<< TOPへ
MagicLens : Self-Supervised Image Retrieval with Open-Ended Instructions
・画像に加えて「その内部からみた様子」などプロンプトを与えると、該当する画像を出力するMagicLensの紹介。2024年。
・ほんとに魔法みたいで不思議。既存のサイトから画像の関係性を含んだ学習データを作ってるみたい。膨大なデータ作って学習させてるのかぁ。良くこんなアイディア考えるなぁ。力でぶん殴って感じで、すごい。
・前の論文にもトリプレットって書いてあったけど、RDFトリプルを思い出した。概念的に似てる。