2/5ページ

2/5ページ

MacBook Pro 2018 15インチを買おうとしていたが、13インチに心替えした理由

MacBookPro 13インチ(2018)を購入しました。 長年Macを使ってきましたが、Proを冠した機種は初めてです。 貧乏性なのです。。。。 買い換えたきっかけ 最近、会社が副業解禁になり色々な方からお仕事いただくようになり、MacBookAir 11インチでは限界を感じてました。 11インチは画面が小さく、絶妙な塩梅でsafariとexcelを同じ画面に映し出すのに疲れてました。副業の方 […]

[Python]pandasのデータフレームを標準化(偏差値化)する

pandas上でデータを標準化する方法について書いていきます。最近だと正規化と呼んだりもします。変数も特徴量って呼んだり、そういう呼び方でその人のデータ分析の背景が見えてきたりして興味深いなぁ〜とたまに思ったりします。 先ずは、モジュールの呼び出しとダミーデータを用意します。 ダミーデータの作成¶ In [1]: import pandas as pd import numpy as np df […]

[Python]pandasデータフレームでRedShiftのテーブルを作成

たまにPython経由でAmazon RedShift(RDS)で作業していると、pandasで作ったデータフレームをRDS上にテーブルとして作成したいときがあります。というわけで、今回はpandasで作成したデータフレームをAmazon RedShift上にテーブルとして作成する方法を記事にしてみます。 pandas-redshiftのインストール¶ 本来、pandasのデータフレームをRDS上 […]

[Python]pandasの日付データから年、月、日、曜日への変換方法

pandasに文字型として入力されている日付データから年、月、日や曜日への変換の仕方です。平日と休日では当然購買行動にも変化が表れるので、マーケティング分析ではよくこの処理を行います。 モジュールの読み込みとダミーデータ¶ 日付が入っているdateと数値が入っているscoreのダミーデータを作成します。スコアは特に意味はないです。データフレームの雰囲気のために付けてます。 In [1]: impo […]

[Python]ステップワイズの実行

最近、Pythonのsklearnばかりで作業をしております。その際、たまに発生するのが「あれ?sklearnの回帰分析はP値を出力してくれないの?え?ステップワイズもしてくれないの?Rはしてくれるのに。。。」というもう少し推測統計的観点から結果を考察したい場面。statsmodelsというパッケージもあるらしいのですが、なんだかk使い勝手は悪そう。。。ということで今回は、PythonからRを実行 […]

  • 2018.05.27

[Python]pandasの複数カテゴリーを一括抽出

pandasで特定のカテゴリーに該当するデータを抽出することはよくあります。それが複数条件の場合も少なくありません。今回は、カテゴリーデータを複数条件で抽出する方法になります。 モジュールの読み込みとダミーデータの作成¶ In [1]: import pandas as pd import numpy as np In [2]: df = pd.DataFrame({'ID':[1,2,3,4], […]

R

RでTURF分析

今回は、RでTURF(Total Unduplicated Reach and Frequency)分析を行おうと思います。 TURF分析とは¶ TURF分析とは、どのような組み合わせをすれば効率的にリーチができるかを探し出す分析です。TURFというと「芝」という単語になりますが、まったく関係ないです。以下、マクロミルさんの説明がわかりやすいのでご紹介しておきます。 RでのTURF分析¶ RにはT […]

R

RからRDSへの接続

RからRedShift(RDS)へアクセスする機会があり、少しハマった点などもあるので、やり方を残して置こうと思います。 RJDBCでの接続¶ 前準備¶ javaのインストール¶ javaをインストール指定いない場合は、下記のコマンドを実行して、Home brew経由でjavaのインストールを行います。 $ brew cask install java 無事にインスールが完了したら、javaへのP […]

1 2 5