Podcast Episode 173
Episode Transcript
スミス: こんにちは!ハッカーボイスのお時間です。今日は2025年8月30日です。ハッカーニュースの注目トピックを、わかりやすく、面白く紹介します。今日の話題はこちらです。 スミス: 一つ目のニュースは「Embedding-Based Retrievalの理論的限界」。二つ目のニュースは「MetaでのカスタムXR OS構築に対するジョン・カーマックの主張」。三つ目のニュースは「GoogleのAIによるウェブサイト要約を停止する方法」。四つ目のニュースは「Lisp from Nothing, Second Edition」。そして五つ目のニュースは「Wikipediaをグラフとして見る」です。 スミス: 今日のニュース、どれも興味深いものばかりですが、特に、GoogleがウェブサイトをAIで要約することの影響について、あなたはどう考えていますか?それでは、最初のニュースから詳しく見ていきましょう。 スミス: 最初のニュースは「Embedding-Based Retrievalの理論的限界」です。 スミス: この論文は、近年様々な検索タスクで利用されているベクトル埋め込みの限界について議論しています。特に、推論、指示応答、コーディングといった新しいベンチマークにおいて、ベクトル埋め込みが現実的な設定でも理論的な限界に直面する可能性を示しています。論文では、学習理論における既知の結果と関連付け、クエリの結果として返される上位k個のドキュメントのサブセットの数が、埋め込みの次元によって制限されることを示しています。 スミス: ハッカーニュースのコミュニティではどうでしょうか? ジョシュア: あるユーザーは、4096次元のベクトルでも性能が制限されるという考えに言及しています。また別のユーザーは、BM25のようなスパースモデルは次元が大きいため、この制限を受けにくいものの、意味を捉えたり、指示に従ったりすることができないと指摘しています。スパースでありながらセマンティックなモデルが理想的である、という意見もありました。 スミス: 次のニュースです。 スミス: 次のニュースは「MetaでのカスタムXR OS構築に対するジョン・カーマックの主張」です。 スミス: ジョン・カーマック氏が、Meta(メタ)で独自のXR OS(Extended Reality Operating System)を開発することに対する反対意見を述べています。彼は、既存のOSをベースにした方が効率的であり、独自のOSを開発することはリソースの無駄であると主張しています。また、OS開発にはシリコンベンダーとの連携が不可欠ですが、最近のハードウェアは複雑すぎて、完全なドキュメントが提供されないため、独自のドライバを開発することが困難になっていると指摘しています。 スミス: ハッカーニュースのコミュニティではどうでしょうか? ジョシュア: あるユーザーは、カーマック氏の率直な意見が、XROSのマネージャーからHRに報告される事態になったことに驚きを示しています。また別のユーザーは、Metaがパフォーマンス評価を重視するあまり、カーマック氏のような著名な人物からの批判がチームの士気を低下させる可能性があると指摘しています。一方で、カーマック氏の意見は正当であり、XROSプロジェクトはコアテクノロジーチームにとって不要なものであったという意見もありました。 スミス: 次のニュースです。 スミス: 次のニュースは「GoogleのAIによるウェブサイト要約を停止する方法」です。 スミス: Googleが検索結果にAIによる要約(AI Overviews)を導入したことで、ウェブサイトのコンテンツがGoogleによって要約され、サイトへのトラフィックが減少する問題が発生しています。記事では、このAI要約を停止する方法として、metaタグを使用してスニペットの長さをゼロに設定したり、すべての要約をブロックしたりする方法を紹介しています。ただし、これらの方法はサイトのクリック率を低下させる可能性があるため、EUやイギリスでの規制の動きに期待する声も上がっています。 スミス: ハッカーニュースのコミュニティではどうでしょうか? ジョシュア: あるユーザーは、パブリッシュするという行為は、コンテンツへのアクセスを人々に与えることであり、Googleの決定もその一部であると指摘し、GoogleのAI要約を批判しています。別のユーザーは、AI要約がGoogle自身の利益を損なうのではないかと疑問を呈しています。また、ウェブサイトをインデックスされないように設定しているにもかかわらず、Internet Archiveがサイトをスクレイピングしていることに不満を抱いているユーザーもいました。 スミス: 次のニュースです。 スミス: 次のニュースは「Lisp from Nothing, Second Edition」です。 スミス: この本は、最小限のLISP言語で自己解釈や自己コンパイルを行う方法について解説しています。シンプルなメタサーキュラー評価器から、自己完結型のCプログラムを出力するフルコンパイラまで、複数の実装を提供しています。第二版では、LISPとラムダ計算の関係に関する章が追加され、マクロに関するセクションで準引用が導入されています。LISPハッカーがパンチカード、テレタイプ、メインフレームコンピュータの時代にどのようにハッキングしていたのかについても触れられています。 スミス: ハッカーニュースのコミュニティではどうでしょうか? ジョシュア: あるユーザーは、LISPのリスト構造について、より効率的な表現方法を提案しています。また別のユーザーは、LISPの独善を取り除く試みについて言及し、Dylanという言語がその例であると紹介しています。さらに、LISPとラムダ計算の関係について質問するユーザーもいました。 スミス: 次のニュースです。 スミス: 最後のニュースは「Wikipediaをグラフとして見る」です。 スミス: Wikipediaの記事をノードとし、記事間のリンクをエッジとするグラフを作成し、2つの記事間のパスを検索するツール「WikiGrapher」が紹介されています。これにより、一見関係のない記事同士が、どのように繋がっているかを探ることができます。例えば、「タイタニック」から「ズーランダー」への繋がりを調べることができます。 スミス: ハッカーニュースのコミュニティではどうでしょうか? ジョシュア: あるユーザーは、カテゴリリンクを除外することで、より面白い結果が得られるのではないかと提案しています。また別のユーザーは、リンクの場所に基づいてエッジに重みをつけることを提案しています。さらに、Wikipediaをグラフとして表現する別のプロジェクトであるWikidataを紹介するユーザーや、Wikipediaの記事を巡って目的地にたどり着くゲームを紹介するユーザーもいました。 スミス: さて、本日のハッカーボイスでは、Embedding-Based Retrievalの理論的限界、MetaでのカスタムXR OS構築に対するジョン・カーマックの主張、GoogleのAIによるウェブサイト要約を停止する方法、Lisp from Nothing, Second Edition、そしてWikipediaをグラフとして見る、という5つのニュースをお届けしました。 スミス: 次回のハッカーボイスでは、どんな面白いニュースが飛び込んでくるでしょうか。楽しみに待ちましょう!ではまた次回。2025年8月30日のハッカーボイスでした。
