V
Motion Reference Videos
ViTPose + MediaPipe パイプライン
元動画
ViTPose検出
手を振る
体 6param 顔 11param
motion: wave wave.mp4
元動画
ViTPose検出
お辞儀
体 6param 顔 11param
motion: bow bow.mp4
元動画
ViTPose検出
拍手
体 6param 顔 11param
motion: clap clap.mp4
元動画
ViTPose検出
腕組み
体 6param 顔 11param
motion: arms-crossed arms-crossed.mp4
元動画
ViTPose検出
ガッツポーズ
体 6param 顔 11param
motion: fist-pump fist-pump.mp4
元動画
ViTPose検出
頷き・挨拶
体 6param 顔 11param
motion: nod nod.mp4
元動画
ViTPose検出
考える・首傾げ
体 6param 顔 11param
motion: think think.mp4
元動画
ViTPose検出
会話・強調
体 6param 顔 11param
motion: talk talk.mp4
元動画
ViTPose検出
驚き
体 6param 顔 11param
motion: surprise surprise.mp4
元動画
ViTPose検出
笑顔・楽しい
体 6param 顔 11param
motion: happy happy.mp4

パイプライン構成(体6 + 顔11 = 17パラメータ)

STEP 1 — 骨格検出
ViTPose
動画フレームから17関節キーポイントを検出。ParamAngle / BodyAngleとして体6パラメータに変換(頭・首・肩・肘・手首・腰)
STEP 2 — 顔検出
MediaPipe Face Mesh
468ランドマークから顔11パラメータを生成。目開閉・眉上下・口形状・視線方向・頭部回転(Yaw/Pitch/Roll)
STEP 3 — スムージング
One Euro Filter + Bezier補間
One Euro Filterでジッター除去(cutoff=1.0Hz, beta=0.5)。キーフレーム間はBezier曲線で補間し自然な動きを生成