Data-centric AI(DCAI,モデル中心のAI)とは,Andrew Ng氏が2021年に提唱した,モデルよりもデータに主眼を置くというAI開発のアプローチである1.従来のAI開発では,モデルの改善に重点が置かれる.これに対し,DCAIでは,データの改善に焦点を置いている.データの改善を重要とする根拠には,ノイズの少ない高品質なスモールデータの方が,ノイズの多いビッグデータよりも,学習した結果,高い性能が得られる場合があることが示されている.Data-centric AIに対して,従来のモデルを改善するアプローチはModel-centric AIと呼ばれる.具体的に,DCAIにおけるデータの改善では,誤ったラベルの修正,エッジケースを表現するデータ例の追加,データ拡張の適用などによりデータを品質を高める.