データサイエンス

pythonコード

【Python Coding】Plotlyを用いてグラフに「第2軸」を追加する方法

pythonの「plotly」を使って可視化をしている方向けに、グラフの「第2軸」を追加する方法を紹介した記事です。 測定指標の異なるデータ同士を表示させたい場合に必須の「見せ方」となるので、軸設定がうまく出来ずに悩んでいる方は参考にしてみてください。
pythonコード

【Python Coding】Plotlyを用いて「箱ひげ図」を描く方法を紹介

pythonを使ってデータをインタラクティブに可視化出来るツール「plotly」の使い方を紹介した記事です。 今回は、アヤメのデータセットを例に用いて「Boxplot(箱ひげ図)」を描く方法を解説しています。plotlyを用いて可視化出来るようになりたい方は参考にしてみてください。
pythonコード

【Python Coding】Plotlyを用いてデータを可視化する方法を紹介

pythonを用いてグラフを「インタラクティブ」に可視化することが出来る方法「plotly」について紹介した記事です。 シンプルな例を用いて紹介しているので、「plotlyの基本的な使い方を知りたい方」や「データをよりわかりやすく可視化したい方」は参考にしてみてください。
pythonコード

【Python Coding】pandas「agg」でデータ集計を効率化する

pythonのpandas機能「agg」の使い方について解説した記事です。 pandasを使ってデータフレームをグルーピングした後に「agg」関数を適用することで、効率的なデータ集計を実現出来るので、参考にしてみてください。
pythonコード

pythonの「tqdm」って何?簡単な例を用いて使い方を紹介

pythonで使えるライブラリ「tqdm」について紹介した記事です。 「tqdmって何?」という方から、「tqdmを用いるメリットや使い方」を知りたい方向けに、簡単な具体例を使って解説しています。興味のある方は参考にしてみてください。
pythonコード

【Python Coding】numpyの「info」で数値型データの範囲を知る

pythonのnumpyを使って、「数値型データ(int型やfloat型)」の取り得る値の範囲について紹介した記事です。 「int64型」と「int32型」などが取れる値の範囲を把握しておくことで、データ分析時により容量の小さいデータ型に変換することも出来るようになります。
プログラミング勉強法

pythonでデータ分析をしたい方にオススメの本を紹介【厳選6冊】

「pythonを使ってデータ分析したいけど、本が多すぎて何から手をつければいいかわからない」といった方向けに、データ分析関連のオススメ本を紹介した記事です。データ分析初心者の方から、上級者向けの本まで、ロードマップ的に紹介しているので参考にしてみてください。
pythonコード

【Python Coding】pythonで株価データを取得する方法を紹介

pythonを使って株価を取得する方法を解説した記事です。具体的には、pandasから派生した機能「pandas_datareader」を使って米Yahoo Financeから有名企業の株価データを取得していきます。pythonを株価を取得してみたい方や興味のある方は参考にしてみてください。
pythonコード

【Python Coding】pythonで為替レートを取得する方法を紹介

pythonの「pandas_datareader」というライブラリを用いて、為替レートを取得する方法を紹介した記事です。具体的には、Yahoo Financeから為替レートを取得する基本的な操作方法や、クロス円の通貨ペアを取得してグラフ化する方法までを紹介しています。
pythonコード

【Python Coding】pandasでデータフレームのユニーク値を抽出

pythonのpandasを用いて、データフレームを構成する要素のユニーク値を抽出する方法を紹介した記事です。データフレームの構成要素を「重複なし」でカウントしたい場合に使える方法を「3つ」紹介しているので、興味のある方は参考にしてみてください。
pythonコード

【Python Coding】pandasの「rolling」で統計量を算出する方法

pythonのpandasにある機能「rolling」について解説した記事です。rollingという方法は、「移動平均」を算出したい場合によく使われる方法で、平均以外にも合計や標準偏差といった統計量の算出が可能です。時系列データ分析をしたい時には使える手法なので、参考にしてみてください。
pythonコード

【Python Coding】pandasの「apply」を使って関数を適用する

pythonのpandasを用いて、データフレームの行列に関数を適用する方法である「apply」の使い方を紹介した記事です。 具体例も用いて紹介しているので、applyを知らない方だけでなく、使い方を知りたい方も参考にしてみてください。 「applymap」についても軽く紹介しています。
pythonコード

【Python Coding】pandasでデータフレーム内の文字列を抽出

pythonのpandasを使って、データフレームに含まれる「文字列」を抽出する方法を解説した記事です。 ある列(カラム)に含まれる文字列を抽出したいような時に使える方法を「3つ」紹介しているので、興味のある方は参考にしてみてください。データ分析の幅が広がるはずです。
pythonコード

【Python Coding】pandasの「isin」を使って条件抽出をする

「pandasのisinって何?」という方向けに、具体的な使い方を解説した記事です。pandasのisinを理解することで、より自分が欲しいデータをデータフレームから抽出し、精度の高いデータ分析をすることが可能になります。データ抽出のレベルアップを図りたい方は参考にしてみてください。
pythonコード

【Python Coding】pandasのshiftを用いてデータをずらす方法

「pandasに出てくるshiftって何?」「pandasのデータフレームの値をずらしたい」という方向けに、shiftの基本的な意味や使い方を紹介した記事です。データ分析の幅を広げることにも繋がる方法なので、参考にしてみてください。
pythonコード

【Python Coding】pandasでデータフレームから値を削除

pythonのpandasを用いて、データフレームから不要な行や列の値を削除する方法を解説した記事です。必要に応じてデータフレーム内の不要な値を削除出来るようにすることは、より良い前処理やモデル精度の向上にも繋がるので是非参考にして使えるようにしてください。
pythonコード

【Python Coding】pandasでデータフレームから値を取得

「pandasのデータフレームから行列の値を自由に取得したい」と考えている方向けに、よく使うデータ抽出方法を中心に解説した記事です。pandasを使ったデータフレーム操作が自由に出来ることで、より良いデータ分析が可能になるので参考にしてみてください。
pythonコード

【Python Coding】コードチェックを効率的にするassertの使い方

「pythonのassertって何?」という方向けに、assertの意味と使い方を解説した記事です。assert文を使えるようにすることで、効率的にコードチェックやエラー確認をするように出来るので、活用したい方は参考にしてみてください。
pythonコード

【Python Coding】pandasでデータフレームをグループ化する方法

pythonのpandasを使って、データフレームをグループ化する方法を紹介した記事です。グルーピングが必要となるケースや、グループ化の方法「groupby」について具体例を用いて説明しているので、参考にしてみてください。
pythonコード

【Python Coding】pandasでカラム(列)を追加する方法

pythonのpandasでカラム(列)を追加する方法を解説した記事です。今回もシンプルな例を用いて、カラムを追加する方法を2通り紹介していますので、「カラムの追加方法が毎回わからなくなる」「カラムを追加する必要性が今一つわからない」と言った方は参考にしてみてください。
pythonコード

【Python Coding】pandasでSeriesを作成する方法

pythonのpandasを使って「Series」型データを作成する方法を紹介した記事です。Seriesの基本的な作成方法から、DataFrameとの関連性について解説しています。「Seriesってなんで必要なの?」という方は是非参考にしてみてください。
pythonコード

【Python Coding】pandasでデータフレームを結合(キー結合)

pythonのpandasを使ってデータフレーム同士を結合する方法を解説した記事です。データフレームの結合方法にはいくつかありますが、今回はデータフレーム同士に共通する「キー」を使って結合する「merge」について紹介しています。
pythonコード

【Python Coding】pandasでデータフレームを結合(単純結合)

pythonのpandasを使ってデータフレーム同士を結合する方法を解説した記事です。python初心者の方にもわかりやすいように、シンプルな例を用いて紹介しているので、ご自身のローカル環境でコーディングして理解を深める参考にしてみてください。
pythonコード

【Python Coding】関数の可変長引数(*args,**kwargs)を解説

「pythonの関数引数に出てくる*argsや**kwargsって何?」という方向けに、意味や使い方を解説した記事です。 *argsや**kwargsは「可変長引数」と言われるもので、タプルや辞書型のデータを扱う時に非常に便利な手法となります。
pythonコード

【Python Coding】pandasでデータフレームを作成する方法

pandasを使ってデータフレームを作る方法をわかりやすく理解したい方向けの記事です。pandasのDataFrameを用いて、ゼロベースから作る方法、辞書型を用いる方法、numpyを用いる方法、時間要素を反映する方法など、シンプルに紹介しています。
pythonコード

【Python Coding】pandasを使って数値型データを抽出&圧縮

「pandasで読み込んだデータフレームのデータ型を確認したい」「データサイズが大きすぎるから、データ容量を軽くしたい」といった方向けの記事です。pandasで「データ型を確認する方法」や「to_numeric」を使って「データサイズを圧縮する方法」を中心に紹介しています。
pythonコード

【Python Coding】pandasを使ってデータサイズを確認&変換

pythonのpandasを使って読み込んだファイルのデータサイズ(KBやMB等)を確認する方法やデータ単位を変換する方法を紹介した記事です。データサイズを確認して自由に変換出来るようにすることは、データサイエンティストにとって「必須のスキル」なので参考にしてみてください。
仕事・副業・転職系

【データ分析】データの基本単位「MB」や「GB」を理解する

「今さらだけど、MB(メガバイト)やGB(ギガバイト)ってどういう意味だっけ?」とデータ容量の基本単位について理解したい方向けの記事です。データ分析の観点から「データ容量を意識する必要性」を紹介しているので、データサイエンスの勉強をしている方も参考にしてみてください。
pythonコード

【Python Coding】Label Encoding

カテゴリ変数を数値化する前処理方法の一つである「Label Encoding」について解説した記事です。データに「欠損値がない場合」と「欠損値がある場合」とにわけて、その理由とコーディング方法をpythonを用いて紹介しています。
pythonコード

【Data Visualization】seabornを使って可視化する(その10)【Heatmap】

seabornを使ったデータの可視化についてシリーズで紹介している記事です。今回はデータ間の関係を可視化する方法である「ヒートマップ」についてpythonを用いて紹介しています。
スポンサーリンク