Top > ラーニング > 京都大学、Pythonの基本を解説した無料の教科書「素晴らしすぎる」「非常にわかりやすくて良い」
Information 2024/1/8: pandas , Polars など18を超えるライブラリを統一記法で扱える統合データ処理ライブラリ Ibis の100 本ノックを作成しました。長期目線でとてもメリットのあるライブラリです。こちらも興味があればご覧下さい。 Ibis 100 本ノック https://qiita.com/kunishou/items/e0244aa2194af8a1fee9 2023/2/12: 大規模データを高速に処理可能なデータ処理ライブラリ Polars の 100 本ノックを作成しました。こちらも興味があればご覧下さい。 Polars 100 本ノック https://qiita.com/kunishou/items/1386d14a136f585e504e はじめに この度、PythonライブラリであるPandasを効率的に学ぶためのコンテンツとして
Pythonを今まで適当に書いてきましたが、プログラムをしっかりと作りたいと考え、いろいろ勉強・調査しました。そこで学んだことをこの記事に書きます。 参考情報 Google Python Style Guide: 全部読み切れていませんが、いいこと書いてあります。 エキスパートPythonプログラミング改訂2版: 初中級というより中級者向け。読み飛ばしている部分も多いですが、懐に置いておいて必要時に読みたい本。一皮むけたい人にはとてもおすすめ。 コーディング規約 PythonにはPEP8というコーディング規約があります。せっかくあるので従うべきでしょう。PyCharmのようなIDEを使うと警告を出してくれるので効率よくPEP8に準拠したプログラムを書くことが出来ます。 私感で重要と考えるものだけ簡潔に抜粋しておきます。 コードのレイアウト 1レベルインデントするごとに、スペースを4つ使う
機械学習Podcast「TWiML&AI」で先週取り上げられた可視化ライブラリ「Yellowbrick」が非常に便利だったので紹介します!ちなみにPodcastには作者の1人であるRebecca Bilbroさんが出演しているので興味持った方は是非聞いてみてください。 twimlai.com www.scikit-yb.org Yellowbrickとは 一言で言うと、機械学習に特化した可視化ライブラリです。実装的な面で言うと(こちらの方がわかりやすいかもしれません)、scikit-learnとmatplotlibをラップして、scikit-learnライクなAPIで使うことができるものです。 例えば相関行列のヒートマップをプロットしたい場合は次のように書くだけでグラフを作ることができます。 visualizer = Rank2D(features=features, algorithm=
Chainer チュートリアル 数学の基礎、プログラミング言語 Python の基礎から、機械学習・ディープラーニングの理論の基礎とコーディングまでを幅広く解説 ※Chainerの開発はメンテナンスモードに入りました。詳しくはこちらをご覧ください。 何から学ぶべきか迷わない ディープラーニングを学ぶには、大学で学ぶレベルの数学や Python によるプログラミングの知識に加えて、 Chainer のようなディープラーニングフレームワークの使い方まで、幅広い知識が必要となります。 本チュートリアルは、初学者によくある「まず何を学べば良いか」が分からない、 という問題を解決するために設計されました。 初学者は「まず何を」そして「次に何を」と迷うことなく、必要な知識を順番に学習できます。 前提知識から解説 このチュートリアルは、Chainer などのディープラーニングフレームワークを使ったプログ
Pythonで電卓アプリを作ってみよう 先日、Windows 10標準の電卓アプリがオープンソースで公開されて話題となった。筆者も気になってソースコードを覗いてみた。電卓は実用的なアプリである上に、それほど難しいわけではないので、実際に作ってみると、プログラミング技術のレベルアップに役立つ好例だ。それでは本連載でも電卓を作ってみよう。 (記事) Microsoft、電卓アプリをオープンソースで公開 今回作る電卓アプリ 電卓の挙動を観察してみよう 電卓を作るにあたって、どんな電卓を作るか考えてみよう。オープンソースになったWindows 10の電卓では、現実の電卓に近い動作をする設計になっている。それに対して、Androidに付属している電卓では「1 + 2 × 3」と入力して「=」ボタンを押すと、かけ算が優先されて計算されるので、7と答えが表示される。Windows 10で同じようにボタン
News¶ 2019/12/06: 講義資料Ver 1.1を公開(2019年度版) 2018/12/17: 講義資料Ver 1.0を公開(2018年度版) 本講義資料について¶ 本ページは 日本メディカルAI学会公認資格:メディカルAI専門コースのオンライン講義資料(以下本資料) です. 本講料を読むことで,医療で人工知能技術を使う際に最低限必要な知識や実践方法を学ぶことができます.本資料は全てGoogle Colaboratoryというサービスを用いて執筆されており,各章はJupyter notebook (iPython notebook)の形式(.ipynb)で以下のリポジトリにて配布されています(notebooksディレクトリ以下に全ての.ipynbファイルが入っています): japan-medical-ai/medical-ai-course-materials 想定受講者¶ 受
ちょっと探して見つからず、何とかかんとかして出し方わかったのでメモ。 お題は「pandas DataFrame内にNaNありますか?」 データがちゃんと処理されているかの簡易的なチェックとして、データフレーム内にNaN値あるか、それがどこにあるか調べたい。 NaNを埋めたい/消したいならfillna()/dropna()使えばいいのだけど、今ここでやりたいのは**「NaNがあるか調べて、その行(列)を表示すること」** 例として、このデータフレームの2-4行目、または1-3列目だけを抜き出したい。 df=pd.DataFrame(np.random.randn(5,5)) df.ix[2:, 1:3] = np.nan df.columns=list('abcde') df # [Out]# a b c d e # [Out]# 0 -0.678873 -1.277486 -1.06223
Irisデータは、 例えば次のサイトからcsvデータを入手できる。 https://vincentarelbundock.github.io/Rdatasets/datasets.html というサイトから Package Item Title Rows Cols datasets iris Edgar Anderson's Iris Data 150 5 のCSVをクリック&ダウンロードで、データ取って来るのが一つの方法で。 pythonで、機械学習のsklearnというライブラリーからdatasetをimportしてって方法もある。 (追記: 2017-05-23) #!/usr/bin/env python import numpy as np import matplotlib.pyplot as plt fig = plt.figure() ax = fig.add_subplo
やること コード データ作成 集計 + 上位の丸め込み コード全体 出力 やること 変数が三つある時によくやるのでメモ。 データで例えると「映画の視聴回数」「変数A」「変数B」で回数ごとに A, Bの変数に変化があるかを調べたい時にとりあえず見てみる。 大抵データの上位はサンプルが少ない(映画の例だと、映画を何百回も見る人は少ない)ので、上位の例は「視聴回数 x 回以上」でまとめてしまう。 ごり押しで書いたのでやり方全然スマートじゃないですね。 コード データ作成 from numpy.random import * import pandas as pd import numpy as np N = 2000 # データ数 data_a = randint(0,100,N) data_b, data_c = randn(N), randn(N) 集計 + 上位の丸め込み # group
今回kaggleの初心者向き課題の一つであるHousingPriceに挑戦しました。とはいいつつも項目数が70以上もあり、参加している人もレベルがかなり高いので前回挑戦したタイタニックに比べればはるかに難しいです。 HousingPriceとは 米国アイオワ州のエイムズという都市の物件価格を予測する問題となります。データは、”築年数”、”設備”、”広さ”、”エリア”、”ガレージに入る車の数”など79個の項目数および1460戸の学習データが与えられます。そのデータをもとに、残りの1459戸の家の価格を予測します。 はじめに 今回課題を取り組むにあたって以下のkernel、ブログを参考にしました。 Stacked Regressions : Top 4% on LeaderBoard | Kaggle こちらのリンクでは欠損値の埋め方等を参考にしました。 KaggleのHousePrices問
pandas は可視化のための API を提供しており、折れ線グラフ、棒グラフといった基本的なプロットを簡易な API で利用することができる。一般的な使い方は公式ドキュメントに記載がある。 Visualization — pandas 0.17.1 documentation これらの機能は matplotlib に対する 薄い wrapper によって提供されている。ここでは pandas 側で一処理を加えることによって、ドキュメントに記載されているプロットより少し凝った出力を得る方法を書きたい。 補足 サンプルデータに対する見せ方として不適切なものがあるが、プロットの例ということでご容赦ください。 パッケージのインポート import matplotlib.pyplot as plt plt.style.use('ggplot') import matplotlib as mpl m
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く