
NECが複数のカメラでカバーする物流倉庫・工場や建設現場などの広い作業エリアで、複数の作業員の作業行動を事前学習なしで認識・データ化できるAI技術を開発した。
2026年度までの実用化を目指し、作業現場全体の可視化を加速させる計画だ。
従来のカメラ映像から作業行動を認識する技術では、現場における特定の作業行動を認識するために、現場映像データの収集とAIモデルの学習に数週間程度の時間を要していた。
新技術では視覚言語モデル(VLM)を活用し、「棚から荷物を取り出している」「台車を押して運んでいる」といった作業行動の説明テキストを入力するだけで認識できる仕組みを実現した。
人とモノとの関係性を捉える独自AIモデルにより、人が触れたり操作したりする物体を特定し、雑多な物体が混在している作業現場でも正確な作業行動の認識が可能になった。
複数のカメラを跨いで移動する作業員を、服装などの外観の特徴に頼ることなく識別できる点も大きな特徴だ。
各カメラ画像に映る人物の位置から、デジタルツイン空間における人物の位置を推定し、複数カメラ間で同一人物を高精度に同定することで、現場全体で長時間にわたって作業員ごとの作業行動実績をデータ化できる。
2026年度までの実用化を目指し、作業現場全体の可視化を加速させる計画だ。
テキスト入力のみで作業認識が可能な画期的技術
従来のカメラ映像から作業行動を認識する技術では、現場における特定の作業行動を認識するために、現場映像データの収集とAIモデルの学習に数週間程度の時間を要していた。
新技術では視覚言語モデル(VLM)を活用し、「棚から荷物を取り出している」「台車を押して運んでいる」といった作業行動の説明テキストを入力するだけで認識できる仕組みを実現した。
人とモノとの関係性を捉える独自AIモデルにより、人が触れたり操作したりする物体を特定し、雑多な物体が混在している作業現場でも正確な作業行動の認識が可能になった。
複数のカメラを跨いで移動する作業員を、服装などの外観の特徴に頼ることなく識別できる点も大きな特徴だ。
各カメラ画像に映る人物の位置から、デジタルツイン空間における人物の位置を推定し、複数カメラ間で同一人物を高精度に同定することで、現場全体で長時間にわたって作業員ごとの作業行動実績をデータ化できる。
WRITTEN by
