問題(令和7年 問8)
AIの機械学習で利用するデータの取扱いに関する記述のうち、バイアスの低減やデータの品質を確保するために考えられる対策として、適切なものだけを全て挙げたものはどれか。
- 学習の目的に適したデータであることを確認する。
- データの入手元・作成来歴を確認する。
- データへのアノテーションの付与は学習目的に合わせて実施する。
- 人間の目でも同定が困難と考えられる画像認識用のデータは除外する。
ア a、 b
イ a、 b、 c、 d
ウ a、 d
エ b、 c、 d
解説(令和7年 問8)
この問題の特徴
- シラバス:Ver.6.2
- 出題分野:企業活動
- 過去問題(公開)出題頻度:よく出た
- キーワード:バイアス アノテーション
バイアス
データが差別、偏見、誤った認識を含んだデータを含んでいること(データの偏り)を言います。
アノテーション
テキストや音声、画像といったさまざまなデータに、情報タグ(メタデータ)を付ける(注釈をつける)ことを指します。機械学習のモデルに学習させる教師データを作成する際に行います。
「バイアスの低減やデータの品質を確保するために考えられる対策として、適切」か、a ~ d を一つ一つ確認します。
a. 学習の目的に適したデータであることを確認する。
目的に応じてデータが抜け漏れなくあることで、詳細な分析ができます。対策として適切です。
b.データの入手元・作成来歴を確認する。
データは意思決定に使われることも多く、信頼できるデータである必要があります。対策として適切です。
c.データへのアノテーションの付与は学習目的に合わせて実施する。
アノテーションとは、テキストや音声、画像といったさまざまなデータに、情報タグを付ける(注釈をつける)ことを指します。引き出したい情報の特徴を「正解」としてAIに学習させるため、「学習目的に合わせて実施する。」は適切です。
d.人間の目でも同定が困難と考えられる画像認識用のデータは除外する。
「人間の目でも同定が困難と考えられる画像認識用のデータ」があると、AIの学習効率が低下します。「除外する。」は、適切です。
よって、a ~ d 全てが適切なので、正解は イ です。
コメント