JoyPix 話す写真AI「Motion-2」発表

AIによるコンテンツ制作ツールを提供する合同会社JoyPix(本社:東京都江東区)は、2025年9月11日、一枚の写真に命を吹き込み、動きと音声を加える最新AIモデル「Motion-2™(モーション・ツー)」を正式にリリースしたことを発表した。従来のAIモデルが抱えていた表情や背景の不自然さを大幅に改善し、実写の人物から動物、アニメキャラクターまで、まるで本当に話しているかのような自然な動画を最大120秒まで生成できる。この技術は、ビジネスから個人の創作活動まで、幅広い分野での活用が期待される。

合同会社JoyPixが開発した「Motion-2」は、静止画像と音声データを基に、被写体が話しているかのような動画を生成するAIモデルである。従来の技術では課題とされてきた不自然な口の動きや、人物と背景の不整合といった点を独自のアルゴリズムで解消。表情や口の動き、背景描写までを極めて自然に再現し、より滑らかで没入感のある動画制作を可能にした。

合同会社JoyPixのプレスリリースより

今回のアップデートでは、飛躍的な性能向上が図られている。独自の「フルシンク」技術により、音声と顔の微細な動きが精密に同期され、まばたきや首の傾き、感情を帯びた表情など、人間特有の「仕草」を自動で生成する。さらに手や体の動きまで音声に連動させることで、全身を使った豊かな表現が可能となった。人物の動きに合わせて背景も自然に揺れ動くため、シーン全体の臨場感も格段に向上している。

対応範囲の広さも大きな特長だ。実写の人物だけでなく、アニメやイラストといった2Dキャラクターの画風を保ったまま生き生きと喋らせることができ、VTuberやゲームキャラクター制作への応用が見込まれる。また、ユーザーからの要望が多かった動物写真への対応も強化され、ペットが飼主に語りかけるような心温まる動画の生成も可能になった。加えて、生成可能な動画の最大時間は従来の45秒から120秒へと大幅に延長され、製品紹介や教育コンテンツなど、より長い情報伝達にも十分に対応できるようになった。

この技術の活用シーンは多岐にわたる。企業のマーケティング担当者は、静止画広告を動画広告として再活用したり、プレゼンターのアバターでウェビナーを効率的に制作したりできる。SNSクリエイターは、歴史上の人物や絵画を喋らせる教育・エンタメ系コンテンツや、ペットが話すユニークな動画を制作できる。個人利用においても、思い出の写真を動かして家族の歴史を感動的な動画にしたり、特別なメッセージビデオを作成したりといった使い方が想定される。

JoyPixは、「誰もがクリエイターになれる世界」の実現を目指しており、今後「Motion-2」にさらなる長時間対応や多言語対応、リアルタイム生成機能の実装を視野に入れて研究開発を進めるとしている。

開発元である合同会社JoyPixは、「AIで、創造に喜びを」をミッションに掲げるテクノロジースタートアップであり、最先端のAI技術を駆使して世界中の人々のクリエイティビティを解放するサービスを提供している。