2019-12-01から1ヶ月間の記事一覧

機械学習のための特徴量エンジニアリング(本)メモ

べき変換:power transform(対数変換や平方根変換等) 分散安定化変換:valiance-stabilizing transformation とも呼ばれる。 Box-Cox変換:対数変換と平方根変換を一般化したもの(詳細は25ページ) 正規化 ーMinMaxスケーリング:特徴量を[0,1]の値に変換 ー…

機械学習のための特徴量エンジニアリング(本)メモ

べき変換:power transform(対数変換や平方根変換等) 分散安定化変換:valiance-stabilizing transformation とも呼ばれる。 Box-Cox変換:対数変換と平方根変換を一般化したもの(詳細は25ページ) 正規化 MinMax

ビットコインメモ

プルーフオブワークとよばれる仕組みでデータの偽造や二重支払いを防ぐ 具体的には新規ブロックのハッシュ値が一定以上の0が続くナンスの値を総当たり法で求めるため、膨大な計算が必要になる。一つの取引データを改ざんしようとするとそれ以降全てのナンス…

多項式回帰(PolynomialFeatures)における係数、パラメータ等のメモ

説明変数とし(切片は考えない)、次数(degree)を1として考えると によってできた多項式の係数は係数項の行列順(sklearnモデルのでcoef_等で出力される順)は [a,b] の順番である。 同様に次数(degree)を2として考えると、交互作用項を含む形で出力され [a,b,c…

SVC(kernel=’linear’)とLinearSVCの違い

LinerSVC L1/L2正則化パラメータが設定できる。 損失関数に ヒンジロスor 二乗ヒンジロスを指定できる。 multiclassの場合にovr (1 vs the rest :(1 vs他のクラス))が指定される。 https://funmatu.wordpress.com/2017/05/20/svckernellinear%E3%81%A8linear…

特徴量選択についてのまとめ

RFE(Recursive Feature Elimination):すべての特徴量から部分集合を取り出してモデルを訓練させることを繰り返し、最適な部分集合を決める SVC等でも利用可能 SelectFromModel:Lasso 等で特徴選択し、邪魔な特徴量を排除して計算するモジュール https://qi…

Djangoメモ

マイグレーション:モデルからデーターベースのテーブルを作成すること orm:オブジェクト関連マッピング:データーベースの操作方法

Lassoのよさそうな説明サイト

https://stats.biopapyrus.jp/sparse-modeling/lasso.html

スクレイピングメモ

import urllib.request urllib.request.urlretrieve(url名,./保存するファイル名) でファイルとしてダウンロードできる retrieve:日本語は:取り戻す、回収する、(情報を)引き出す、検索する等 https://www.sejuku.net/blog/67698