単語漁り

「単語を漁る」とは

頭語・基本語の派生語や便利な単語を探す行為のことです。トップランカーが毎日死んだ目で行っています(多分)

収録基準

今のところ単語の収録基準として有力なのが「Wikipedia」「はてなキーワード」です。多分他にも元とした資料があるはずですが、特定はできません。「ムーミン柄」とかどこにあるんだ。あとはユーザーの収録希望で載ることが多いです。ゲーム用語とかそこそこあるっぽいです。

あたりまえだけど、全ての記事が登録されているわけではなくて、載っていないものも多いです。単純にデータ取得のあとに作られたものだとか、謎の基準で消されたものとかあるみたいです。

多分サービス終了するまで「自分が打った単語が通らない」と言われ続ける、悲しい運命なのです。。。

Wikipedia

頭の堅い人たちが作ってる百科事典。出典や特筆性で殴って弱い記事を殺すことで質を保つ。

  • Wikipedia索引
    • Wikipedianが手作業で作ってる狂気の一覧ページです。読み順で載ってるのは便利。
  • 先頭が同じ全ページ
    • 機械的に作られてる一覧ページ。読みには対応してないが、上で漏れてるものも逃さない。

はてなキーワード

頭のゆるい人たちが作ってる百科事典。ネタ記事1行記事なんでもござれ。

はてな検索も五十音順一覧もゴミなので、ここから一覧をダウンロードしちゃいましょう。たかだか12MBのcsvです。エクセルで読み取ろうとすると文字化けするので、データ>テキストファイルでエンコードを直してから入れるといいです。「う゛」を上手いこと処理してあとは関数とかフィルタとか使って必要な部分を抜き出そう。プログラミングできる人はいいのを作ろう。