<< TOPへ
The Manga Whisperer: Automatically Generating Transcriptions for Comics
・視覚障害者が漫画を理解できるように、あらすじを文章にまとめる仕組みを提案。漫画をDeepLearningで解析。2024年。オックスフォード大学の研究で、漫画を主題にしていることが面白い。
・生成モデル名前が「Magi」であることがなんとも、良い。エヴァか!
・キャラクターを一致させる必要があるし、それに紐づいている吹き出しも関連付ける必要があるし、バックではグラフを使いながら論理的にまとめていくことがすごい。
・まだ生成AIは考慮に入っていない。でもあらすじを文章化できているということは、まさに文字を処理できるわけなので、生成AIを使った展開が超楽しみ!