2007年01月10日

にせ個人情報ジェネレータ「なんちゃって個人情報」

ロゴ

せっかく公開したので、誰か使ってくださる方がいればいいんですが……
てんででたらめな個人情報リストを生成できます。エクセルのテストデータにするもよし、データベース的なものを扱うプログラムのサンプルデータにするもよしということで。

以前Idea * Idea瞬時にテストデータを大量生成してくれる『Data Generator』という記事を読んで、Perlの練習にちょうどいいかも……と 思ってはいたんですが面倒くさくてなかなか出来ずにいました。やっとできました。
Data GeneratorではSQLも出力できますが、そういうのさっぱりなので理解できるXMLだけにしておきました。

とにかく名前の打ち込みがちょーめんどーでしたが、苗字については頑張って1000種類入れました。これで日本人の苗字7割をカバーできるらしい。名前については、タレントのとかを適当に入れただけでバリエーションが少ないですが、まあテストデータということで勘弁して下さい。

婚姻や血液型、都道府県は統計データを調べてそれに基づいた割合で出力するようにしました。数年前に「世界がもし100人の村だったら」なんて本が流行りましたが、あのノリで「あーやっぱりAB型は少ないなあ」とか楽しんだりもできます。

この記事へのコメント
ひそかにこういうのを待っていました。ありがたく使わせていただきます。
要望として、メールアドレスも勝手にでっち上げてもらえるといろいろありがたいです。
Posted by Nasty at 2007年01月19日

会社名や住所なんかもでると非常にいいと思います。
Posted by 小島情報 at 2007年01月19日

職業なども欲しいですね。
Posted by 、 at 2007年01月19日

すばらしい!感動した!
Posted by kmdsbng at 2007年01月19日

GIGAZINEの記事から来ました。DB開発に非常に重宝しそうです。ありがとうございます。私もメールアドレス生成希望ですが、ありえなさそうなメールアドレスを作るのはちょっと難しいでしょうか。存在しないTLDで作るとか。
Posted by Takeshi* at 2007年01月19日

面白すぎ!
こういうジョークは素敵!
でも「サンタマリア」多すぎだろw
Posted by あーく at 2007年01月19日

でも、一青窈とかユースケサンタマリアなんかはサンプルから除いておいてほしかったです。
Posted by こういうの探してました。 at 2007年01月20日

すばらしい! 感動です。こんどフィッシングサイトを見かけたときにここで生成したデータを突っ込んでやりたいです。
ところで、カレーの食べ方で、ほかのは大体わかるのですが、多数いらっしゃる「ルー攻め派」と「せき止め派」がどういう食べ方かわかりません・・・。よろしければ教えて下さい。
Posted by zaba at 2007年01月20日

外国人バージョンもプリーズ
Posted by at 2007年01月20日

ちょっと面白いですよねー。
一応報告しておくと、電話番号の市外局番は0で始まらなくてはいけなかったり、住所の県名と市外局番の組み合わせがあり得ないものだったり、市外局番は2桁から5桁までいろいろな長さのものがあったりする難点がありますね。直して意味があるかどうか微妙ですが:)
Posted by いしばし at 2007年01月20日

メールアドレスのドメインはexample.comとかでどうでしょう。アカウント名はseesaaとかはてなから引っ張ってくるのは駄目ですかね。
http://blog.seesaa.jp/contents/ranking.html
http://d.hatena.ne.jp/diarylist?mode=rss

名前はいまっぽくなっちゃいますが以下でどうでしょう。たまひよの方は「人気」ですが率もついてます。
http://women.benesse.ne.jp/hakase/sitemap/namae.html
http://5go.biz/sei/cgi/ninki1.htm
http://5go.biz/sei/cgi/ninki2.htm
Posted by typer at 2007年01月20日

くりらじテクノロジーニュースで紹介されていたのでおじゃましました

面白いアイデアですね
一つ気になったのですが生成された情報の電話番号なのですが、頭がランダムですよね
普通は市外局番の頭は”0”なので、頭だけは0にした方がリアリティーのある情報になると思います
Posted by た〜 at 2007年01月21日

みなさま、お使いいただいてありがとうございます。作者のkazinaです。爆発的なアクセスが、と思ったらGIGAZINEに掲載されてたんですね。GIGAZINE恐るべし。

とりあえず新しい項目としてはメールアドレス、住所、職業あたりがよさそうですね。追加する時はこの3つ優先にします。

電話番号については少なくとも頭を0にするように直したいと思います。住所と連動して市外局番くらいは、というのも最初は考えたんですが面倒そうなのでやめた経緯があります。

あとユースケサンタマリア、一青窈等名前のサンプルがタレントなので、ちょっとウソっぽい点はタレントの名前を省く、というオプションを付けたいなと。typerさんが名前のページを紹介してくださったので、そちらを使えば大丈夫そうですし。ありがとうございます。

>zabaさん
カレーの食べ方はジョークで付けただけなのであまり追求されても困るのですが、攻めはルーをご飯にかけていくタイプ、せき止めは逆にご飯をルーの方に寄せながら食べるタイプということで。
Posted by kazina at 2007年01月22日

かなり面白いですね
仕事にも使えるかもです
名前のふりがなですが「ひらがな」と「カタカナ」から選択できたりするといいですね。
Posted by Clashking at 2007年01月22日

是非使ってください。カタカナいいですね、実装も難しくなさそうです。追加機能の候補にさせていただきます。
Posted by kazina at 2007年01月22日

キャリアにウィルコムも入れて下さい。
Posted by 輪王ひろみ at 2007年01月22日

どこかのブログでも「ウィルコム」がないのはおかしい、と書かれていました。知人もウィルコムを使っていますし、契約数のデータが見付かったらちゃんと入れたいと思います。
Posted by kazina at 2007年01月23日

待ってました!!コレ!
発展させてったらWebサイト作成のセオリー

都道府県の隣に都道府県コードのカラムを作って頂けたら嬉しいです!
Posted by imai at 2007年01月23日

有益さと面白さをかねそなえてすばらしいと思います。
欲を言わせていただければ、携帯を持っていない人や、血液型が不明な方もいるわけで、実際のアンケートやユーザリストでも「無回答」とか「不明」または空白がふくまれます。そういったイレギュラ処理のテストも出来るよう、空白とか「なし」とかも出力できるオプションがあるとうれしいな。
Posted by nobody at 2007年01月28日

ご使用ありがとうございます。

都道府県コードというものを知りませんでした……でもすぐに付けられそうです。

無回答や不明もいいですね。今時は家伝がない人も多いですし。オプションでそういうものも出力できるようにしたいなと思います。
Posted by kazina at 2007年01月28日

早速試しに出力してみました。
前職ではデータチェックの際にそれこそ「なんちゃって」な個人情報を作ったりしたものです。
こういうものがあると便利でいいです。

ただ、名前の欄をフルネームで作成したとき、苗字だけなのか名前だけなのかという名前(例:岡 、武藤、 光など)が出力されているのに目が付きました。

#自分と同じ携帯番号が生成されているのを見つけたときにはびっくりしました(爆
Posted by alp-w at 2007年02月01日

北海県はひどいと思います(><)
Posted by petit at 2007年02月05日

alp-wさん
ご使用ありがとうございます。苗字だけ、名前だけを出力してしまうのかもしれません。その辺見直してみます。8桁の携帯番号はわりと簡単に一致してしまうものですね……扱いには注意して下さい(^^;

petitさん
気付いてませんでした。マジひどいですね(><)
申し訳ないです、直します。
Posted by kazina at 2007年02月07日

ちょうどそこそこ本当っぽい大量データが欲しかったので使わせていただきました。

ただ、「黒岩」さんだけがふりがなも「黒岩」のままのようです。
Posted by tta at 2007年02月27日

ご報告ありがとうございます。よく気付いていただきました。とりあえずそこだけ直したので、もう大丈夫だと思います。
Posted by kazina at 2007年03月13日

いつも使わせていただいています。
工藤の振り仮名が全て「こんどう」になっているようです。
Posted by WAQ at 2007年03月22日

ご報告ありがとうございます。気付いていただき助かります。くどうに修正したのでよろしくです。
Posted by kazina at 2007年03月23日

すごくいいですね。

希望は。。。
メールアドレスと
英数字のIDになるようなものぐらいかな。
Posted by KT at 2007年04月17日

IDの代わりになるようなものはまだありませんが、メールアドレスは出力できるようになりましたのでもしよろしければお試し下さい。
Posted by kazina at 2007年04月24日

コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。
この記事へのトラックバックURL
http://blog.seesaa.jp/tb/31159677
※ブログオーナーが承認したトラックバックのみ表示されます。

この記事へのトラックバック

なんちゃって個人情報
Excerpt: データベースを使用したプログラムを作っていると、ほとんどの場合が氏名、住所、電話番号などの情報を扱うことが多いです。プログラム作成後、それらの情報を適当に入力して確認を行うのですが、この「適当」がなか...
Weblog: Hibi日記
Tracked: 2007-01-20 06:07

なんちゃって個人情報
Excerpt: なんちゃって 個人情報 捏造 テストデータ
Weblog: and Words
Tracked: 2007-01-21 02:19

にせ個人情報ジェネレータ「なんちゃって個人情報」
Excerpt: 面白いもの見つけました。プログラム等に使えるかもしれない個人情報のテスト用データを自動生成してくれるそうです。出力形式 HTML・XML・CSV(カンマ区切り)・タブ区切りk4類を出力形式として選択で...
Weblog: お仕事好きネット好き面白好き
Tracked: 2007-01-30 11:37