「Kaggleのチュートリアル」の第5版をKindleで公開しました。 公開から5日間限定で、無料公開を行っていますので、是非ダウンロードください。

- 作者:カレーちゃん
- 発売日: 2020/12/22
- メディア: Kindle版
この記事はKaggle Advent Calendar 2020 - Qiitaの25日目の記事として書いています。
Kaggleとは
KaggleはWikipediaでは次のように書かれています。
Kaggleは企業や研究者がデータを投稿し、世界中の統計家やデータ分析家がその最適モデルを競い合う、予測モデリング及び分析手法関連プラットフォーム及びその運営会社である。 モデル作成にクラウドソーシング手法が採用される理由としては、いかなる予測モデリング課題にも無数の戦略が適用可能であり、どの分析手法が最も効果的であるかを事前に把握することは不可能であることに拠る。 2017年3月8日、GoogleはKaggle社を買収すると発表した。 Wikipediaより
もう少し簡単に説明すると、
- 機械学習のコンペが開催され
- 参加者は無料で参加することができ
- 予測に順位がつけられ
- 他の人が公開コードなども見ることができる
と、機械学習の勉強や練習にとても良いプラットフォームとなっています。
Kaggleは、はじめるのが、少しだけ難しい
機械学習の勉強をするのにとても良いKaggleですが、ウェブサイトが英語で作られていたり、データの理解が難しいコンペだったりと、はじめるのは少しだけ難しいです。
私も最初にはじめた時は、機械学習も初学者なのに、英語を読む必要がありとても苦労したのを覚えています。
そこで、これからKaggleをはじめる方には、ウェブサイトの使い方やコンペへの取り組み方などだけは、絶対につまづかないようにということで、「Kaggleのチュートリアル」という同人誌を2018年4月に公開しました。
これまで3000部以上を購入してもらっていますが、好評いただいていると思います。
この度、そのKaggleのチュートリアルをKindle版として公開しました。 12月28日までは無料ダウンロード可能ですので、是非ダウンロードしてもらえればと思います。
Kaggleのチュートリアル目次
本編
- 1章 Kaggleについて
- 2章 コンペのページの説明
- 3章 まずは、サブミットしてみる
- 4章 タイタニックデータの概要
- 5章 LightGBMでのタイタニック
付録
- A pandas-profilingでのEDA
- B LightGBMについての補足説明
- C Santander Value Prediction Challengeで金メダルを獲得しました
- D HomeCreditコンペ 銀メダルを獲得するために行ったこと(寄稿)
- E PerFinderコンペでのValidationの失敗談
- F Kaggleの称号と用語集
- G データ分析の勉強方法
- H Kaggleに2年間半取り組んで学んだこと
第4版から更新したところ
第4版からの大きな更新点は次の2点です。
- KaggleのUIの変更に対応
- H Kaggleに2年間半取り組んで学んだことを追加
前者は、この10月から11月ごろに、KaggleのNotebookのUIに大きな変更があったため、その変更に対応しました。 後者は、第4版の、「Kaggleに1年間取り組んで学んだこと」を現時点版に更新しました。特にCVスコアについての記述は第4版は良くなかったなと思い大きく書き直しましたので、第4版を読まれた方も読んでもらえればと思います。
もらった感想など
@currypurin さんのKaggleチュートリアルkindle unlimitedで買い直し(持ってるのは第1版)
— a.yam (@yachts111xenon) December 24, 2020
LightGBMでの前処理から交差検証,コンペの取り組み方針,特徴量作成と項目同士の突き合わせ法各種,アンサンブルやスタッキング,実験の管理法まで充実の内容でした.付録が豪華すぎ #kaggle pic.twitter.com/ADZBgT2gFW
くるぴーさんに寄稿してもらった、Homecreditコンペの体験談は、kaggleはじめての方におすすめの神記事です!! https://t.co/lWdpqZGNh7
— カレーちゃん (@currypurin) December 24, 2020
Kindleストアの売れ筋ランキング、無料本のランキング1位ゲット! pic.twitter.com/gspuUoy2j7
— カレーちゃん (@currypurin) December 24, 2020
参考サイト
Kaggleのチュートリアルの第1版から第4版 (販売は終了しています)
kaggleのチュートリアル。第4版公開しました|カレーちゃん|note
この本を読んだ後の学び方など
機械学習初心者がKaggleの「入門」を高速で終えるための、おすすめ資料などまとめ(2020年8月版)|カレーちゃん|note
その他、思ったこと
ここ数年の国内でのKaggleの盛り上がり
ここ2年間ほど、日本でのKaggleは大きく盛り上がったと思います。 次のツイートのように、Kaggleで好成績を残すともらえる称号のKaggle GrandmasterやKaggle Masterの日本人割合もとても増えています。
新しくMaster/GMになった人数を年度別で集計してみましたhttps://t.co/zaXHJmApwB pic.twitter.com/tq0GddBoQH
— Appian (@Appian42) December 18, 2020
また、2018年のKaggleで勝つデータ分析の技術の発売を皮切りに、次のように多くの書籍も出版されました。(公開順に記載)
- Kaggleで勝つデータ分析の技術
- データサイエンスの森 Kaggleの歩き方
- 実践Data Scienceシリーズ PythonではじめるKaggleスタートブック (KS情報科学専門書)
- kaggleで上位に入るための探索的データ解析入門
- Kaggleで学んでハイスコアをたたき出す! Python機械学習&データ分析
- Pythonで動かして学ぶ! Kaggleデータ分析入門 (AI & TECHNOLOGY)
- Kaggleコンペティション チャレンジブック
来年はどうなるのかとても気になります。
kindle direct publishing(KDP) 簡単ですぐに公開できた
この本はAmazonのKDPというサービスを用いて作成しました。
これは、WordやPagesで書いた原稿を、簡単にKindleで公開できるサービスです。
午前中に登録した原稿が、午後にはKindle版として公開されていて、そのスピード感に驚きました。
2020年とても流行ったようですが、来年は更に流行りそうと思いました。
これについては、別で書きたいと思います。
長くなりましたが、これで終わります。 この記事はKaggle Advent Calendar 2020 - Qiitaの25日目の記事として書きました。

- 作者:カレーちゃん
- 発売日: 2020/12/22
- メディア: Kindle版