ラベル blekko、アルゴリズム、110万のスパム、ドメイン、排除、検索エンジン、Google、Xappy、電通 の投稿を表示しています。 すべての投稿を表示
ラベル blekko、アルゴリズム、110万のスパム、ドメイン、排除、検索エンジン、Google、Xappy、電通 の投稿を表示しています。 すべての投稿を表示

2011年3月10日木曜日

Blekkoがアルゴリズムによって110万のスパムっぽいドメインを排除―【私の論評】検索エンジンもまだまだ考えようがある?

Blekkoがアルゴリズムによって110万のスパムっぽいドメインを排除

blekkoは、/mapを入れれば、地図を検索する
blekkoの事務所はガレージ?

検索エンジンBlekkoによれば、同社は検索結果からおよそ110万のスパムっぽいドメインを閉め出すことに成功した。門前払いを食らわされたドメインは同社が開発したアルゴリズムが同定したもので、そのアルゴリズムはとくに、粗悪なコンテンツや広告のタイプなどを嗅ぎ分ける。それは同社が一貫して展開している戦端に新兵器として加わり、コンテンツファームや低劣なコンテンツを撃退していく。これに先立ち同社は今年の初めに、検索結果から20のコンテンツファームを排除した。

同社はこのアルゴリズムを、“AdSpam.”と呼んでいる。同社曰く、“ページがスパムであることのもっともどぎつい兆候の一つは、セルフサービス広告のネットワークに大量に参加していることだ”。そのほかの兆候に基づいて粗悪なサイトを同定し、そこにキーワードに基づく広告がコンテンツに並んで大量にあれば、ブロックされる可能性が高い。〔余計な訳注: では、Googleの検索結果ページもだ!?〕

“粗悪コンテンツとキーワード広告の組み合わせは、金を印刷する機械だ”、とBlekkoのCEO Rich Skrentaは言う。“金を印刷する機械は、いずれ悪用されるだろう”。

彼によれば、Blekkoは一日に100万の検索クェリを処理し、50万の月間ユニークビジターがある。


Blekko image
Website:blekko.com
Location:Redwood Shores, California, United States
Founded:June 1, 2007
Funding:$24.4M
Blekko is a search company founded by Rich Skrenta and his core team from previous companyTopix and Netscape’s Open Directory. Blekko was founded halfway through 2007 and has already earned itself an angel… Learn More

【私の論評】検索エンジンもまだまだ考えようがある?
日本でも、YahooがGoogleの検索エンジンを採用することを決めたように、検索エンジンは集約化され、私自身も、そうして多くの方も、もう検索エンジンなどは、開発つくされ新しいものなど出てこないと思っていたのですが、そうではなかったのですね。

私も、試しに検索してみました。今のところ、まだ使い込んではいないので、その真価を問うことはできないとおもうのですが、それにしても、検索を余計なものが出てこないのは、良いことです。

特に、個人的な使用であれば、そうでもないのですが、仕事で検索などしているとき、必要もないような山のような情報の中から選び出すのは一苦労です。そんなときに、blekkoは役に立ちそうです。

これって、やはり、ユーザーの立場にたったからこそ、開発できたのではないかと思います。だれだって、山のようなスパム情報にはうんざりしているはずです。

さて、この検索エンジンに限らず、日本でも新しいものが開発されています。


Xappy(ザッピー)は、インターネットメディアを対象とした、ザッピングエンジンです。

ザッピングとは、リモコンのボタンを押し、チャンネルを頻繁に切り替えながらテレビ視聴する行動のことですが、Xappyは、このザッピング視聴をインターネットのサイトを対象にできるようにしたサービスです。

Xappyベータ版では、流行りや注目の情報、その日、その時に関連したサイトなどを自動的に収集し、スコアリングしたシナリオと呼ばれるトピックスの集合に対して、ザッピングするものになります。
このトピックスは、複数(単体の場合もある)のサイトによって、定義づけられていて、ボタンを押すことで様々な話題を把握することができ、興味のあるトピックスに関しては、ドリルダウンによって関連する情報を閲覧することも可能です。

これに関しては、実際に検索などしていただかないと、言葉で説明してもなかなかわからないと思います。下に、概念図だけ掲載しておきます。



こちらの方は、何が良いかというと、あまり言葉を知らなくても、検索できるという事だと思います。従来の検索エンジンに関しては、キーワードが重要であり、語彙力がなければ、満足のいく検索ができないおそれがあります。上で掲載した、blekkoも素晴らしい検索エンジンなのですが、この点は同じだと思います。

Xappyの場合は、あまり語彙力がなくても、かなり検索できると思います。語彙というと、これに関して最近面白い体験をしました。最近ひょんなきっかけで、20代の女性が「逢瀬」という言葉を知らないということを発見しました。

逢瀬」は皆さんご存じだとは、思いますが、小説などにはでてきても、学校のテキストなどにはまずは、出てこない言葉だと思います。だから、知らなくても、別にほとんど困るということはないでしょうが、この言葉を知らないということであれば、他の文学的な語彙もあまりわからないのではないかと思います。

それにしても、この女性は、国立の文系4大を卒業しているのですから、最近の特に若年層は語彙力が極端に落ちているのではないかと思います。最近では、ソ連とかナチスと言っても、その言語の意味がわからない若者が多いので、映画の字幕作成者も困ってるいという話もききますし、だからこそ、最近では、字幕ではなく音声吹き替えのものが多くなっていると話もききます。それから、これも、以前のブログに書いたことがありますが、「貞操」という言葉を知らない4大卒の女子なんて、ざらにいます。これも、以前のブログに書いたと思います。

このような状況を鑑みると、やはり、検索エンジンもいくつかのものがあるのが良いと思います。子供や、若者向けには、Xappyとか、もっと語彙を習得た上位者にはblekkoとか・・・・・・。

とにかく、ユーザーの立場にたって見れば、まだまだ、検索エンジンの新しいタイプがいくらでもできそうな気がします。皆さんは、どう思われますか?

【関連記事】
Google Japan Blog: Google マップの不動産検索について―【私の論評】情報過多の時代に人の果たす役割は?
Googleのウェブマスターツールが新興検索エンジンの足を引っ張っている?
Funny Restaurant 検索エンジンを新設しました―グーグルのカスタム検索、これもクラウド・コンピユーティングによるサービスの一例
Googleのウェブマスターツールが新興検索エンジンの足を引っ張っている?
日本人の知らない日本語が流行っている―最近の死語について驚いた件?

財政審「コスト重視」の噴飯 高橋洋一氏が能登復興遅れ激白 補正予算編成せず 過疎地の財政支出「ムダと認識」で邪推も―【私の論評】災害対策の予算措置は補正予算が最適!予備費では遅れる

高橋洋一「日本の解き方」 財政審「コスト重視」の噴飯 高橋洋一氏が能登復興遅れ激白 補正予算編成せず 過疎地の財政支出「ムダと認識」で邪推も 高橋洋一 能登半島地震の復興が、従来の復興に比較して遅れている。 野口健氏が「東京と現地の温度差」を指摘し、被災者に「見捨てられた」感があ...