Live2Dモーション生成に使用した参照動画。左:元動画、右:ViTPose骨格検出。 体パラメータ(ViTPose 6個)+ 顔パラメータ(MediaPipe Face Mesh 11個)= 合計17パラメータ/フレーム