画像検索システムの開発方法に関するアイデアが欲しい

algorithm content-based-retrieval image-processing search-engine
画像検索システムの開発方法に関するアイデアが欲しい

Googleが画像を検索する方法についてもっと勉強したいだけです。 私には複雑すぎることはわかっていますが、自分の画像セットでそれを試してみたいと思います。

これは私が提案する方法です:フォルダー内のランダムな画像の大きなセットに対して、いくつかのキーワード(適切ではないかもしれませんが、あなたのアイデアに基づいて変更される可能性があります) 。

画像間の類似性を判断する方法について、グラフィックの人々と話をしたことがあります。

  1. グローバルカラーヒストグラム

  2. 画像レイアウトとブロックベースのヒストグラム(私はあまり馴染みがありません
    と)

  3. RAGベースの説明。

だから、今私は本当にあなたのアイデアが必要です、コードや何かは必要ありません、あなたはそのようなローカル画像検索システムの設計であなたが考えるかもしれないものを共有してください、画像間の類似性をどのように定義しますか?画像などを表します

グラフィックの人々と話を続けて学びますが、あなたのアイデアが私を始めてくれることも本当に欲しいです。

  2  1


ベストアンサー

TinEyeは、私が見た唯一の画像ベースの検索エンジンです。 FAQにはいくつかの技術的な詳細がありますが、重要な制限(「イメージシグネチャ」の構築に使用する検出器の種類についても少し説明しています)は次のとおりです。

__
* TinEyeは同様の画像を見つけることができますか? TinEyeは顔認識を行いますか?*

TinEyeは、トリミング、色調整、サイズ変更、大幅な編集、わずかな回転など、送信した画像の正確で変更されたコピーを見つけます。 TinEyeは通常、同様の一致を返しません。また、画像の内容を認識できません。 これは、TinEyeが同じ人や物で異なる画像を見つけることができないことを意味します。
__

3


Googleは画像の単なるテキスト検索以上のことを行っています。http://googleblog.blogspot.com/2009/11/explore-images-with-google-image-swirl.html [Google公式ブログ]のこの投稿をご覧ください。 _visual_機能での画像検索(コンテンツベースの画像検索-CBIR)は、*未解決の研究問題*であることを忘れないでください。

グローバルカラーヒストグラムはがっかりする可能性があります(たとえば、米国とフランスのフラグは同様のグローバルカラーヒストグラムを表示しますが、非常に異なります)。 ローカルカラーヒストグラムは、そのフラグの例に対してより良い結果を生成できます。

UCSDでhttp://www.svcl.ucsd.edu/projects/[Nuno Vasconcelos ‘work]をご覧ください。

3


Google画像検索では、さまざまな手法を使用して、表示される結果を返しますが、(残念なことに)最大のものは、別のWebページのコンテキストです。 Googleの通常の検索結果と同様に、画像の近くにある単語は、画像内の内容を判断するのに役立ちます。

一部の画像には、Googleの共同ラベリングゲームなどのツールでタグが付けられていますが、それ以外の場合はすべてコンテキストです。

これはおそらくあなたの目標をあまり助けませんが、残念ながら、白い子猫に白い馬を確実に伝えることができるコードはまだありません。 顔の認識は別の問題ですが、それはあなたが尋ねていたものではありません。

1


グーグル画像は連想テキスト検索に基づいていると思います。 画像コンテンツの認識を試みるほとんどの試みは、今日では精度が低く、有用である方法があります。 そのようなアルゴリズムの開発に心から関心がある場合は、まず、考えられるオブジェクトの数と写真の性質がある程度制御されている簡単な問題をターゲットにします。 調べたいもの:

Computer Vision:デジタル画像から有用な情報を取得する方法、色分布、エッジ、円などの直接的なプリミティブ情報。

http://en.wikipedia.org/wiki/Object_recognition [オブジェクト認識]:オブジェクトを検出する方法。

http://en.wikipedia.org/wiki/Machine_learning [機械学習]:アプリケーションを自己改善させます。

ImageJ、コンピュータービジョンオープンソースアプリは、開始するのに適した場所です。

0


他の提案と一緒に、http://en.wikipedia.org/wiki/Facial_recognition_system [顔認識]をチェックしてください。

そのような技術の商業的な例は、http://www.apple.com/ilife/iphoto/ [AppleのiPhoto]です。

0


タイトルとURLをコピーしました