2018年9月

データサイエンティスト協会の「データサイエンス力」スキルチェックをやってみる(No1〜No3)

人から「データサイエンティスト」と呼ばれる度に、「あんなの飾りです。偉い人はそれがわからんのですよ。」と思ってました。正直、明確な定義があるわけではないので、名乗ることに罪悪感があるんですよね。あなた、本当にデータサイエンティストなの?って方にも多く巡りあってきましたし。そんな自分の罪悪感を察してか「データサイエンス協会」がデータサイエンティストとしての必要なスキルセットをリストにまとめてくれてま […]

[Python] 名称からコード、コードから名称への変換

データ分析の前処理で名称からコードへの変換、またはコードを名称への変換の作業はよくあると思います。今回は、その変換をPythonの辞書(dict)で使って行う方法です。 データ例の用意¶ 実際に行っていくので、変換するデータと変換対応のリストを用意します。 In [1]: import pandas as pd import numpy as np #性別 prefecture_labels = […]

[Python]PlotlyをつかってSankey Diagram(サンキーダイアグラム)を描いてみた。

今回はplotlyを使ってSankey Diagram(サンキーダイアグラム)を作成してみます。最初、グラフの名前がわからず調べるのに苦労しました。 疑似データの作成¶ 今回のプロットするための疑似データを作成してみます。データはCRMデータの会員離脱を想定してます。ただ、傾向を付与するものは面倒なので「年代」と「性別」とは独立であるとしてます。すみません。 In [1]: import pand […]