OFUNATO DATA ANALYTICS

岩手県大船渡市で、データアナリストを目指して勉強中です

岩手県の病院の数から、少しだけ地域医療について考えてみた

 みなさんこんにちは。今回のデータ分析は、岩手県の病院の数の分布について調べてみました。

 

1、調べようと思った理由

 1ヶ月ほど前に、知人が腎結石で入院することになりました。腎結石自体は、適切に処置をすれば命に関わる病気ではないことから、自分も気をつけなきゃね、くらいに考えていました。

 

 

しかし、知人は、大船渡から100km離れた盛岡まで行き、1週間×2の入院生活を送らなければなりませんでした

 

 

 この時自分は、自分の住んでいる場所に大変不安を感じ、データ分析に対するモチベーションが非常に高まり、今回岩手県の病院の数を記事にすることにしました。

 

 

2、参考にしたデータと、データの表示方法

  1. 岩手県の病院(病床数20床以上)をリストアップ。
  2. データの参照元https://www.med-info.pref.iwate.jp/pdf/meibo.pdf
  3. Pythonのfoliumモジュールを使い、岩手県の病院の数を地区ごとに表示。

 

 

3、結果 

 

 まず、表示された地図をみてください。地図上で、岩手県のうえに、「89」という数字が表示されていると思います。

 

 

 次に、地図上で、上にスクロールしてください。数字の書かれた玉が分裂したと思います。これは、岩手県北部に病院が13か所あり、岩手県中部と南部に病院が76か所あることを示しています。

 

 

 さらにスクロールしてくと、また玉が分裂し、詳細な岩手県の地区ごとの病院の数を調べることができます。

 

 

 この地図を見て推測できることは、

  • 岩手県東北自動車道沿いの地帯に病院の数が多い
  • 岩手県南部の病院数は、内陸と沿岸部にあまり差がない
  • 岩手県北部の山間部は、病院の数が非常に少ないのではないか

 

 といった所でしょうか。

 

4、まとめ

 今回は少し地域医療に関わる問題について考えてみました。地図上に表示された数を見ながら、内陸部に住むおじいちゃんおばあちゃんは医療に不安なく暮らせてるのかな、とか、医者の数は足りてるのかな、とか・・・。

 

 

 今までの社会って、例えば医療の分野は医療関係者だけで、教育の分野は教育関係者だけで、といった感じで、専門家がそれぞれの立場で責任を持って頑張ってこられたのだと思うのですが、

 

 

 人口の減少、経済の停滞等によって、現在生じている様々な社会問題は、もはや専門家のみで解決できる段階を超えているような気がします。

 

 

 引きこもりの問題にしろ高齢者ドライバーの問題にしろ、あらゆる社会問題というのは、私自身と何らかの関係性があり、こうした社会問題に対しては、ほんの少しでも良いからコミットしていかなければならないような気がします。

 

 

 

 

 

 

たのはたヨーグルトの美味しさについて個人的な考察〜自分好みのヨーグルトを見つけるには〜

 皆さんこんにちは。私は今年のゴールデンウィークに、東京の高円寺にある大船渡市のアンテナショップ「三陸SUN」で、岩手県田野畑村で作られている「たのはたヨーグルト」を、帰省の際、家族へのお土産として購入しました。

 

www.tanohatamilk.com

 

sanriku-sun.com

 

 私が「たのはたヨーグルト」を購入した理由ですが、私は以前に一度、大船渡市で、この「たのはたヨーグルト」を食べ、まるで田舎の隠れ家的なレストランで提供されているような、素朴かつ上品な味わいにはまってしまったからです(個人の感想です笑)。

 

 

 「たのはたヨーグルト」の良い点は、ヨーグルトの甘さと粘り気がちょうどいいなぁという所でしょうか。市販されているヨーグルトって、「甘さはちょうどいいんだけど水っぽすぎるなぁ」とか、逆に「水っぽくなくていいんだけど、甘さが足りないなぁ」などど、私の個人的趣向にマッチするヨーグルトにこれまで出会うことがなかったのですが、「たのはたヨーグルト」は甘さと粘り気のバランスが絶妙です!!

 

 

 今回、「たのはたヨーグルト」と、一般に市販されているヨーグルトの成分を比較すれば、「たのはたヨーグルト」の美味しさの秘密をつかめるのではないかと思い、分析してみました。

 

 

1、分析対象

 「たのはたヨーグルト」を含め6つの市販されているヨーグルトの、成分分析表を元に分析しました。ヨーグルトの名前は、

  1. たのはたヨーグルト(田野畑村開発産業公社)
  2. Bifix (江崎グリコ株式会社)
  3. ナチュレ 恵 (雪印メグミルク株式会社)
  4. 小岩井生乳100%ヨーグルト (小岩井乳業株式会社)
  5. ブルガリアヨーグルト (明治乳業株式会社)
  6. プレミアム湯田ヨーグルト (株式会社湯田牛乳公社)

 

分析した成分は、100gあたりの

  1. カロリー (energy、単位:kcal)
  2. タンパク質 (protein、単位:g)
  3. 脂質 (fat、単位:g)
  4. 炭水化物 (carbohydrate、単位:g)
  5. カルシウム (calcium、単位:mg)
  6. 無脂乳固形分 (non milk solid単位:%)
  7. 乳脂肪分 (milkfat単位:%)

 

↓は今回のデータ(ヨーグルト毎の成分表)です

商品名 カロリー
(kcal)
タンパク質
(g)
脂質
(g)
炭水化物
(g)
カルシウム
(mg)
無脂乳固形分
(%)
乳脂肪分
(%)
たのはたヨーグルト 98.0 4.3 3.9 11.5 101.0 8.1 3.6
Bifix 70.0 3.8 0.7 13.0 115.0 8.8 0.5
ナチュレ 恵 63.0 3.6 3.1 5.2 110.0 9.5 3.0
小岩井生乳100%ヨーグルト 65.0 3.2 3.8 4.6 110.0 8.3 3.5
ブルガリアヨーグルト 62.0 3.4 3.0 5.3 109.0 9.5 3.0
プレミアム湯田ヨーグルト 118.0 3.9 6.3 11.3 132.0 9.0 6.0

 

 

2、分析手法

 それぞれのヨーグルトの成分量ごとに順位づけし、ヒートマップでランキングを可視化する

 

3、結果

f:id:Kihei171:20190520131123p:plain

 

 この表は、100gあたりのヨーグルト毎の成分の量を、ランキング化したものです。色付けされた四角の真ん中に書いてある数字が、成分量毎の順位です。例えば、表の一番右下の黄色は、「プレミアム湯田ヨーグルト」の「milkfat(乳脂肪分)」が、6つのヨーグルトの中で一番多く含まれていることを示しています。

 

 ヒートマップによる色分けについては、黄色に近づくほどランクが高く、青に近づくほどランクが下がります。

 

 一番左上の「Tanohata」(たのはたヨーグルト)についてみてみましょう。たのはたヨーグルトは、カロリー、タンパク質、脂質、炭水化物、乳脂肪分が2位以上、しかしカルシウムと無脂乳固形分が最下位と、エッジの効いた結果が出ました。

 

 「たのはたヨーグルト」の甘さについて考えてみます。「たのはたヨーグルト」の甘さのランクは「2」なので、市販されているヨーグルトの中では、かなり甘いことがわかります。甘党である私は、純粋に糖分(炭水化物)がより多く含まれているヨーグルトが好きだということでしょうか。

 

 「粘り気」についてですが、「たのはたヨーグルト」は、100gあたりに含まれているタンパク質、脂質、炭水化物のランクが高いです。この数値が高いということは、ヨーグルト100gあたりの水分量が少ないということを表しているのではないでしょうか。私は、比較対象として、タンパク質、脂質、炭水化物のランキングが2位、1位、3位の「プレミアム湯田ヨーグルト」を食べてみました。結果、「プレミアム湯田ヨーグルト」も、「たのはたヨーグルト」と同じく、粘り気が強いヨーグルトでした。

 

 しかしながら、同じく粘り気の強い2つのヨーグルトですが、私には、「たのはたヨーグルト」より「プレミアム湯田ヨーグルト」の方が粘り気が強い感じがしました。かつ、「プレミアム湯田ヨーグルト」の粘り気は、私の好みより強いと思いました。なぜでしょうか??

 

 この疑問を考えた時、無脂乳固形分のランキングが気になりました。「たのはた」は6位ですが、「湯田」は3位です。私には、無脂乳固形分がどういうものなのかわからないのですが、無脂乳固形分は、「固形分」ということで、この成分が多いほど、ヨーグルトの水っぽさが無くなり、ヨーグルトに粘り気が出てくるのではないかと思いました。

 

 

4、まとめ

 今回の分析の目的「たのはたヨーグルト」の美味しさの秘密は、

炭水化物が多いため甘く、タンパク質、脂質、炭水化物が多いため水っぽくなく、かつ私個人の好みにあう無脂乳固形成分の量、だと推測しました。

 

 

 また、今回の分析によって、私個人のヨーグルトの好みについてもわかってきて、市販のヨーグルトから好みにあうものを見つけるのであれば、

・「甘いヨーグルトが好き」→炭水化物が多いものを選ぶ

・「水っぽくなく、かつ、粘り気が強すぎないヨーグルト」→タンパク質、脂質、炭水化物を多く含み、かつ、無脂乳固形成分が高すぎないものを選ぶ

 

 この二つを追求していくと、ヨーグルトの美味しさについて追求していけそうな気がします。今回の分析の結果は、まだ推測の域を出ていないので、今後、それぞれのヨーグルトを食べ比べながら、さらに詳しい分析をしていきたいと思います!

 

大船渡の苗字ランキング

 皆さんこんにちは。私は大船渡市に来てから、今年の7月でちょうど2年になります。その間、大船渡市の様々な方と知り合いになりました。私は小さい頃、親の転勤と一緒に、日本の複数の場所で生活してきました。以前住んだ地域それぞれに、苗字の特徴があって、苗字の由来を考察するのが面白かったです。今回、住むことになった大船渡も、苗字に特徴があるなと感じていたため、分析し、可視化することにしました。

 

1、分析の方法、目的

 岩手県大船渡市に住む方々の苗字の、上位1〜40位までを取得(情報源:https://name.sijisuru.com/Area/cityflists/%E5%B2%A9%E6%89%8B%E7%9C%8C?city=%E5%A4%A7%E8%88%B9%E6%B8%A1%E5%B8%82&pages=0)し、苗字の多い順に表示することで、大船渡市に多い苗字の特徴を把握する

 

2、苗字ランキングの可視化

f:id:Kihei171:20190510141412p:plain

myouji

 

 

 上記の図では、文字の大きさによって、大船渡市に多い苗字のランキングを表しています。苗字の大きさは、佐藤>新沼>佐々木となっており、順位と連動しています。私は大船渡で、「今野さん、新沼さん、金野さん」に会うと、地元の方なんだな、とわかるようになりました。下に苗字のランキング表を載せておきます。

ランキング 苗字 苗字の数
1 佐藤 670
2 新沼 520
3 佐々木 500
4 鈴木 410
5 千葉 390
6 村上 380
7 熊谷 340
8 金野 270
9 及川 250
10 今野 240
11 志田 220
12 吉田 150
13 伊藤 140
14 高橋 120
15 小松 120
16 菊地 110
17 三浦 110
18 中村 110
19 大和田 100
20 菊池 100
21 菅原 90
22 平山 90
23 田村 80
24 千田 80
25 菅野 70
26 山口 70
27 後藤 60
28 坂本 60
29 木下 60
30 60
31 山本 60
32 上野 60
33 川原 60
34 田中 60
35 清水 50
36 鎌田 50
37 石橋 50
38 橋本 50
39 滝田 50
40 山崎 50

 

非階層クラスター分析(kmeans法)を使って大船渡市の漁獲量を比較してみる

 皆さんこんにちは。前回の記事では、「階層クラスター分析」によって、年間一万トン以上の水揚げ量がある市町村のクラスタリングを行いました。今回は、「非階層クラスター分析」によって、市町村をクラスタリングし、その特徴を見ていきたいと思います。

 

1、分析の方法

 「非階層クラスター分析」(kmeans法)による分析を行う。「さんま」の漁獲量を基準とし、kmeans法を100回行った結果の、クラスタリングクラスター数を取得し、グラフとして表す。

 

2、分析に使ったデータ

 海面漁業生産統計調査の平成27年度のデータ(https://www.e-stat.go.jp/stat-search/files?page=1&layout=datalist&toukei=00500216&tstat=000001015174&cycle=7&year=20150&month=0&tclass1=000001042343&tclass2=000001097435)から、調査対象の魚類の総漁獲量が一万トン以上ある市町村をピックアップし、「くろまぐろ、かつお、さけ、ます、にしん、まいわし、まあじ、さば、さんま、ぶり、ひらめ、かれい」の漁獲量

 

3、非階層クラスター分析の結果

f:id:Kihei171:20190510103245p:plain

ykmeans

 まず、表の右側を見てください。「ykm_cls」と書いてある下に、1〜5までの色のついたブロックが表示されています。これは、kmeans法によって、各市町村の漁獲量をもとに、市町村が1から5までのグループに分類されたということを表しています。

 

 次に、表の一番左側の棒グラフを見てください。ここは、「1から5グループごとの、くろまぐろの漁獲量がある市町村の割合」になります。例えば、「くろまぐろ」では、紫色で表示された5グループの棒グラフが、90%程の数値を示しています。このことは、5グループに分類された市町村の約90%が、くろまぐろの水揚げがある、ということを示しています。

 

 ここで、それぞれの市町村がどのグループに分類されたか確認してみましょう。

グループ 市町村
1 八戸塩竈市八戸市、女川町、愛南町南知多町鳥羽市新潟市、福岡市など
2 姫路市淡路市神栖市境港市隠岐の島町天草市
3 えりも町、猿払村室蘭市斜里町白老町、様似町、浦河町広尾町など
4 函館市志賀町七尾市根室市厚岸町釧路市浜中町枝幸町雄武町
5 大船渡市いわき市石巻市気仙沼市釜石市宮古市、森町、銚子市など

 

  1グループは、宮城、愛知県が多いグループ、2グループは瀬戸内海、3グループは北海道太平洋側、4グループは北海道太平洋側+石川県、5グループはリアス式海岸沿いといった特徴があるようです。

 

 岩手県大船渡市は5グループに分類されました。5グループは、まいわし、まあじ、さば、さんまのパーセンテージが100なので、青魚がよくとれるようですね。他には、にしん以外の魚のパーセンテージは40を超えているので、色々な魚が取れる漁場があるということも推測できます。

 

 

4、まとめ

 私は魚が大好物なのですが、今まで漁場については疎かったので、今回のクラスター分析によって、漁場の特徴を大まかにですが、つかむことができました。また、クラスター分析を使わなくてもわかるのですが、ぶりやかれいは日本各地で取れるんだ、みたいなことも副次的にわかったことが収穫となりました。

階層クラスター分析を使って大船渡市の漁獲量を比較してみる

 皆さんこんにちは。前回の記事で、日本の市町村ごとの漁獲量のデータを散布図行列にして、水揚げされた魚の種別ごとの漁場を考察できないか、ということに挑戦してみました。今回は、大船渡市の漁獲量と、他市町村の漁獲量を「階層クラスター分析」という手法を使って比較してみたいと思います。

 

1、分析の目的

 「階層クラスター分析」を使用して、大船渡市の漁獲量と他市町村の漁獲量を比較する。「階層クラスター分析」によって、大船渡市の漁獲量の特徴と、似ている市町村、そうでない市町村をクラスタリングした「デンドログラム」という表が得られる。そうして、大船渡市の漁業の立ち位置を考察する。

 

2、分析に使ったデータ

 海面漁業生産統計調査の平成27年度のデータ(https://www.e-stat.go.jp/stat-search/files?page=1&layout=datalist&toukei=00500216&tstat=000001015174&cycle=7&year=20150&month=0&tclass1=000001042343&tclass2=000001097435)から、調査対象の魚類の総漁獲量が一万トン以上ある市町村をピックアップし、「くろまぐろ、かつお、さけ、ます、にしん、まいわし、まあじ、さば、さんま、ぶり、ひらめ、かれい」の漁獲量

 


3、階層クラスター分析によって得られたデンドログラム

f:id:Kihei171:20190509164519p:plain

 

大船渡市は、このデンドログラムの、右から2番目にあります。この表から、最も大船渡市に近い特徴を持つ市町村は、北海道の森町になりました。

ja.wikipedia.org

 

 大船渡市と森町で水揚げされる魚の種類を比較してみます。森町ではにしんが水揚げされますが、大船渡市ではされないといった違いしかありませんでした。漁獲量全体では、大船渡市が年間三万トンに対し、森町は一万トンですが、森町は、すけとうだらとかれいが、大船渡に比べよく水揚げされています。

 

 続いて、表の大船渡市の左側に位置する七尾町と志賀町についてです。

ja.wikipedia.org

ja.wikipedia.org

ja.wikipedia.org

 

 両方とも石川県の市町村です。こういうデータを待ってました!

 

 大船渡市とは、さんまの水揚げがない、という点以外、一致していました。大船渡市は太平洋側、七尾町と志賀町日本海側なのに、こうした共通点があって面白いです。これらの共通点を考えてみると、七尾町と志賀町は北緯37度、大船渡市は北緯39度に位置するため、気温が近く、そのため海水温も近いのでしょうか?

 

 デンドログラムの右から8〜11番目に、気仙沼石巻、釜石、宮古市があります。この4つは、岩手から宮城県にかけての市町村なのですが、個人的に、大船渡市がこの4つの市町村よりも、日本海側の石川県の市町村と近い特徴を持つ、と分析できたことが一つの発見となりました。

 

散布図行列で考える、日本の漁場、大船渡の漁場

 私の住む岩手県大船渡市は、さんまの漁獲量が全国でNo.3平成27年度)を誇ります。しかしながら、近年はさんまの漁獲量が落ち込んでいるそうなのです。地元の漁師の方に話を伺うと、さんまの漁場は年々北上していて、以前のさんまの漁場では、大船渡より南の漁場でよく取れる魚たちが網にかかるようになった、と聞きました。

 

 漁場の北上化によって、漁船の燃料代が以前よりかかるようになります。また、漁場の近くにある大小様々な水産加工場も、水揚げされる魚の種類が異なってくると、機械が対応しなかったり、今までの加工、流通のノウハウが使えず、ダメージを受けます。最終的には私たちの家計にしわ寄せが・・・

 

1、散布図行列によって魚の漁場を考察する

 散布図行列は、複数の散布図を整列させたもので、各項目の相関関係を把握することができます。今回、くろまぐろやさんま、さば等の漁獲量のデータで散布行列図を作成すれば、それぞれの魚の相関関係を把握することで、漁場について考察することができると考え、図を作成してみました。

 

 今回参考にしたデータは海面漁業生産統計調査の平成27年度のデータ(https://www.e-stat.go.jp/stat-search/files?page=1&layout=datalist&toukei=00500216&tstat=000001015174&cycle=7&year=20150&month=0&tclass1=000001042343&tclass2=000001097435)から、調査対象の魚類の総漁獲量が一万トン以上ある市町村をピックアップし、「くろまぐろ、かつお、さけ、ます、にしん、まいわし、まあじ、さば、さんま、ぶり、ひらめ、かれい」の漁獲量のデータで、散布図行列を作成しました。

 

2、散布行列図の考察

f:id:Kihei171:20190508202858p:plain

散布行列図

 見辛くなってしまい大変恐縮なのですが、散布行列図について解説します。例として、くろまぐろとかつおの相関相関関係を確認してみます。1行目の2列目を確認してみてください(くろまぐろと書いてある四角の右、かつおの上です)。この散布図は、白い丸の点が右肩上がりに表示されています。このようなケース、正の相関関係があると考えます。

 

 「くろまぐろ、かつお」以外に正の相関関係があるものとしては、3行目、4列目の「さけ、ます」でしょうか。この二つは他の散布図に比べ、はっきりと右肩上がりであることが確認できます。

 

3、散布行列図のヒートマップ

f:id:Kihei171:20190508204442p:plain

 先ほどの散布行列図は小さく見にくかったので、ヒートマップにしてみました。青い部分ほど正の相関が働き、赤い部分ほど負の相関(関連性が薄い)が働いています。表の左上から右下にかけて青い四角が斜めに並んでいますが、この部分は、「くろまぐろとくろまぐろのデータ」といったように同じ魚のデータを比較していますので、この部分は無視してください。

 

 先ほど述べた「くろまぐろ、かつお」(1行目の2列目)と「さけ、ます」(3行目の4列目)は青で塗られており、正の相関関係です。10行目の1列目、くろまぐろとぶりや、7行目の6列目の、さばとまいわしも同じぐらい強い正の相関関係があります。

 

 それでは、大船渡市の誇るさんまについてみてみましょう。さんまは、かれいと、にしんに対して正の相関関係があるようです。私も、大船渡に来てから、船に乗ってかれいを釣りに行きました。しかし、にしんは大船渡では水揚げされていません。元データを調べてみたところ、にしんは大船渡よりも北のさんまの漁場(釧路、根室など)で水揚げされているようです。

 

4、まとめ

 今回、市町村別の魚の漁獲量のデータを使って、漁場の考察をすることができたと思います。今後は、さんまの漁場の北上問題のように、他の種類の魚でも北上しているものはないか調べてみたいと思いました。

 

農業、ITについて、大船渡を岩手県の他地域と比較してみた


 みなさんこんにちは。私は二年前に、「農業とITの仕事ができる」とのことで、岩手県大船渡市の地域おこし協力隊に応募しました。現在では、農業とITの仕事を両立することができ、大変満足しているのですが、大船渡市は漁業が盛んな市で、農業は目立った存在ではないように感じています。また、IT関連の仕事も市内では少なく、IT企業も数えるほどしかありません。

 

 「そもそも大船渡市は農業とITにおいて、岩手県内ではどういった立ち位置なんだろうか」という疑問が湧いてきました。そこで、岩手県市町村別の、農業と情報通信業の総生産額額のデータを視覚化して、各市町村の立ち位置を考えてみることにしました。

 

 

1、検索対象のデータ

平成28年度の岩手県市町村内総生産の農業と情報通信業の金額(岩手の統計情報(http://www3.pref.iwate.jp/webdb/view/outside/s14Tokei/top.html)から、統計調査名:市町村民経済計算http://www3.pref.iwate.jp/webdb/view/outside/s14Tokei/bnyaBtKekka.html?C=B0302&R=I017)の市町村内総生産 (1)項目別統計表 平成18年度~28年度のxlsxファイルから参照)

 

 

2、市町村別の農業と情報通信業の散布図

f:id:Kihei171:20190508095808p:plain

情報通信業と農業の散布図

盛岡市は金額が飛び抜けているため除外)

 私の住んでいる大船渡市は・・・表の中央から、少し左下寄りに位置したところにありますね。この表は、農業と情報通信業の関連性を示したものなので、例えば表の右側の、やや下側にある北上市は、岩手県の中においては農業より情報通信業に力を入れていることが推測できます。反対に、左側の上にポツンとある二戸市情報通信業より農業に力を入れているのでは、と考えられます。この表から、二戸市は農業の総生産額が県内No3であることがわかります。農業の生産額が多いということは、土地面積が広く、人口も多いのではと推測したのですが、どうしてこのような結果になったのでしょうか?

 

3、岩手県沿岸地帯、矢巾紫波、北上について

 さて、私の当初の疑問であった「大船渡市の農業と情報通信業の立ち位置」をみてみましょう。表の中央から少し左下側に大船渡市があり、さらに大船渡が位置する場所の周辺に、宮古市と、釜石市があります。宮古市と、釜石市は、大船渡市と同じく太平洋沿岸の市です。岩手県の沿岸地帯は、漁業が盛んで、工作地帯が少ないです。

 

 この3つの市を人口順に並べると、釜石<大船渡<宮古になります。情報通信業の金額も釜石<大船渡<宮古となっていますので、この3つの地帯でIT産業の優劣はなさそうです。

 

 大船渡市から話がそれますが、この図表の大船渡の位置から少し左側に位置する矢巾町紫波町について気になることがありました。私は一時期、Instagram岩手県他地域の地域おこし協力隊の情報を集めていたのですが。その際、私のInstagramのタイムラインに矢巾町紫波町の地域おこし協力隊の方の投稿がよく流れて来ていたことを思い出しました。矢巾町紫波町盛岡市にかなり近いので、情報通信業はその恩恵を受けているのかもしれませんが、矢巾町紫波町にはITの仕事があるのでは、と思いました。

 

 また情報通信業No4の北上市も、私のSNSのタイムラインに、IT関連のニュースがよく流れて来ています。この図表の情報通信業の金額と、私のSNSのタイムラインには正の相関があると感じました。そのあたりもデータで示すことができると面白いかもしれないですね。