カレーちゃんブログ

Kaggleや競技プログラミングなどのこと

GoogleColaboratoryでKaggleをやる場合に、一番簡単なデータの読み込みと書き出し方法

GoogleColaboratoryについては、前回の記事(GoogleColaboratoryを使ってみる。これが無料ってすごすぎない? - currypurin’s diary)で少しだけ書きました。
今回は、データのアップロートとダウンロードに限って方法を書きます。
Kaggleをやる際に使えそうです。

データのアップロード

GoogleColaboratoryに、ファイルを取り込む必要があります。おそらく一番簡単なのは、dropboxにあげておいて、!wgetで取り込むのが簡単ではないでしょうか。
dropboxにあげたファイルの共有リンクを取得して、!wget 共有リンクのパスとやりましょう。

【参考】
- colaboratory をつかってみる CSVのファイルをアップロード - Qiita

データのダウンロード

サブミットするデータが出来上がったら、ローカルにダウンロードしてやります。
'submit.csv'というcsvデータが出来上がっているとして、次のようにしてローカルに落とすことが可能です。

from google.colab import files
files.download('submit.csv')

番外

データのアップロードについては、githubが使えて、githubで公開してしまってもよいデータならgithubにアップロードしてそれを読み込むのも早いしお手軽です。
githubで次のようにhttps...のリンクを取得し、!git clone https...としてやれば、レポジトリにあるファイルを一括で読み込むことができます。 f:id:currypurin:20180314100001p:plain

まとめ

自分用のメモも兼ねて書いてみました。
他にこんな方法がいいよとかありましたら、教えてください。