「名字」と「論文数」にはどれくらい関係あるのか?→調べてみたらいろいろ興味深かった「めっちゃ面白いデータ」

伊藤が多いは何となくわかる
65
Ichiro TANAKA (田中一郎) @_knom_

名字と論文数に相関あるか気になって、プロットしてみました。佐藤、鈴木はもっと頑張れ。田中、伊藤、渡辺、山本、森あたりは頑張っている pic.twitter.com/GRAKX6hV6f

2023-01-06 13:25:58
拡大
Ichiro TANAKA (田中一郎) @_knom_

MD, PhD/生きて腸まで届く田中一郎

詳細など

Ichiro TANAKA (田中一郎) @_knom_

論文数はPubmed調べです。名字のデータはmyoji-yurai.netから拝借しました。斎藤と斉藤はまとめて一つにしました。50位までの名字はmyoji-yurai.net/prefectureRank…を参照。ちなみに打率トップ3は森、中島、太田でした

2023-01-06 14:12:28
リンク Wikipedia PubMed PubMed(パブメド)は生命科学や生物医学に関する参考文献や要約を掲載するMEDLINEなどへの無料検索エンジンである。 アメリカ国立衛生研究所のアメリカ国立医学図書館(NLM)が情報検索Entrezシステムの一部としてデータベースを運用している。 1971年から1997年にかけてMEDLINEの利用は主に大学図書館などの機関施設に限定されていたが、 1996年1月に初公開されたPubMedは個人や法人の一般利用への先駆けであった。一般公開は1997年6月に式典にてアル・ゴア副大統領により実演された。
リンク 名字由来net|日本人の名字99%を掲載!! 名字由来net|日本人の名字99%を掲載!! 全国・都道府県別名字ランキング 名字由来net| 全国・都道府県別名字ランキングは? 11 users 1329
Ichiro TANAKA (田中一郎) @_knom_

斎藤さんはPubmedでsaito[au] OR saitou[au] OR saitoh[au]で調べました。saitoeさんやcateauさんは無視しました。悪しからず

2023-01-06 14:15:55
Ichiro TANAKA (田中一郎) @_knom_

山本さんとかは山元の人数足してないので過大評価かも

2023-01-06 14:48:59
Ichiro TANAKA (田中一郎) @_knom_

渡辺さんも、渡部、渡邉、渡邊もPubmedで入ってるからちょっと過大評価かも

2023-01-06 14:51:00
Ichiro TANAKA (田中一郎) @_knom_

伊藤さんも伊東さんと合わさってるか。この辺、手動で探すの面倒だなあ

2023-01-06 15:27:03
Tomo @T45356

@_knom_ これは、森さんなら、森さん一人当たりの平均論文数ですか?

2023-01-07 02:41:54
Ichiro TANAKA (田中一郎) @_knom_

@T45356 違います。縦軸はPubmedという生命科学系のデータベースで過去50年くらいにMoriさんが著者に入ってる論文数、横軸はWebサイトから拾ってきた森姓の人数(たぶん現在)です。乱暴にいうと何%の森さんが論文書いてるかみたいな感じでしょうか

2023-01-07 06:28:01
Ichiro TANAKA (田中一郎) @_knom_

@ZukashiT 人数と論文数は当然相関するはずなんで知りたかったのは相関ではなかったですw

2023-01-07 10:13:32
fugaco @fugaco

面白い。漢字もスペルも名寄せが思ったより大変そう。 婚姻姓が変わった人が別の姓でカウントされる影響って何かあるのかな? twitter.com/_knom_/status/…

2023-01-06 17:33:16
Ichiro TANAKA (田中一郎) @_knom_

昼休みのお遊びなので名寄せは真面目にやってません。リプにもぶら下げたけど、田中(田仲)、伊藤(伊東)、渡辺(渡部など)、山本(山元)には影響あるかもね。佐藤、鈴木は比較的名寄せの影響少なくて、fitted lineより下にいるだけだったりして

2023-01-06 17:38:28
リンク シナジーマーケティング株式会社 SynergyMarketing 「名寄せ」とは? | マーケティング用語集 | シナジーマーケティング株式会社 名寄せとは、複数に分散されているデータベースの同一人物、同一企業、同一世帯に対し、同一のIDを付与するなどしてデータを統合すること。またはその作業。具体的には、顧客を識別する名前、メールアドレス、住所、電話番号などの属性 […] 1 user
Ichiro TANAKA (田中一郎) @_knom_

伊藤(約1,060,000人)、伊東(約109,000人)で97,665報なので、それなりには影響ありそう

2023-01-06 17:41:25
Ichiro TANAKA (田中一郎) @_knom_

名字と論文数の奴、縦軸は過去50年の累計、横軸は最近の数字だから、本当は直接比べられないんだよね。佐藤鈴木の不振は名字の収斂の影響もあるのかもしれん

2023-01-08 07:32:24
Ichiro TANAKA (田中一郎) @_knom_

Pubmedで年を限定するのは簡単だけど、そうするとスーパー伊藤さんとかの影響を受けるから、累計でやってみたんだよな

2023-01-08 07:33:47
のったん @kaze_to_aozora

リプ欄に分かってない人いそうだったけれど、このグラフの見方は実線より左上にいるか右下にいるかです。>RT

2023-01-07 13:20:53

みんなの反応

カイ🧀 @Kaixxxx74

余興としてめっちゃ面白いデータじゃん!

2023-01-07 16:43:25