Jupyter-labの始め方(Ubuntu20.04)

Jupyter-labの始め方(Ubuntu20.04)

こんにちは!

たくです。

僕は普段、ちょっとしたプログラミングを試すときに「Jupyter-lab」という無料のツールを使います。
今回は「Anaconda」を使ったJupyter-labの導入方法を紹介し、始め方をレクチャーします。

データとは

データにもいろいろな種類があります。

  • 数値データ(支出額、気温など)
  • 文字列データ(文章、ツイートなど)
  • 画像データ(写真、イラストなど)
  • 動画データ(スマホやカメラで撮影した動画など)

分析をするという背景では、単体の数字や画像ではなく、それらが集まったものを「データ」と呼ぶと思います。

身近なところで言うと、家計簿データがあります。
「買い物をした日付」「使用用途」「金額」の3項目を1年間つけてみると、立派な「家計簿データ」になるでしょう。僕は普段の買い物をなるべくクレジットカードで決済するようにしていて、月ごとの利用明細をデータとして集めています。

国内でよく利用されているクレジットカードでは、明細をファイルとしてダウンロードできると思います。

データ分析とは

データ分析は、集めたデータ(数字や文字の羅列)を元に、次の行動の指針を決めるために行います。

例えば、「節約をする・支出を減らす」という目的を持っていたとします。
そのために何をするのが効果的なのかを判断するために、家計簿データを分析します。

まずはデータをいろいろな角度から眺めて見ることがスタートラインです。
食費にどれくらい使っているのかを調べたければ、用途別に合計額を出し、1年間の支出全体に対する食費の割合を見ることになります。
お金をよく使う季節・月はいつなのかを調べたければ、月ごとの合計額を出し、各月の支出を比較することになります。

Jupyter-labとは

さて、そんな分析を行うためのツールとして使うのがJupyter-labです。

Jupyter-labは、Pythonなどのプログラミング言語を使った分析や開発を強力にサポートします。

僕がJupyter-labを使い始めたときはPythonを使ったことがない状態でしたが、Jupyter-labのおかげでPythonでいろいろなことがすぐにできるようになりました!!

Jupyter-labを使う

PCにAnacondaをインストールする

Jupyter-labを使い始める方法はいくつかありますが、今回は「Anaconda」を使ったインストール方法を紹介します。
Anacondaはデータサイエンティスト(データを分析する人たち)のために作られた、便利な道具箱のようなものです。Jupyter-labはその道具の一つです。

1.インストーラーをダウンロード

使っているOSに応じて、以下の公式HPからインストーラーをダウンロードします。

https://www.anaconda.com/products/individual-d#Downloads

WindowがMacの場合は「64-bit Graphical Installer」をダウンロードします。ダウンロードしたファイル(インストーラー)を起動し、指示に従ってインストールすれば完了です。

僕はUbuntu20.04を使っているので、Shellで動かすインストーラーをダウンロードしました。
ブラウザからダウンロードするもよし、shellからコマンドでダウンロードするもよしです。

wget https://repo.anaconda.com/archive/Anaconda3-2021.05-Linux-x86_64.sh

2.インストール

ターミナルでインストーラーを起動し、案内に従って進めます。

cd path_to_download/
bash ./Anaconda3-2021.05-Linux-x86_64.sh

3.パッケージのアップデート

最後にAnacondaの設定をして終わりです!

conda update conda
conda config --set changeps1 false

※2行目はpythonの起動時にターミナル上に”(base)”が表示されないようにする設定。

Anacondaの中にJupyter-labも入っているので、これでJupyter-labを使えるようになりました!

Jupyter-labの初回設定

以下の設定は必須ではありませんので、必要に応じて設定します。

1.設定ファイルを生成

各種の設定を書き込む設定ファイルを生成します。ターミナル上で以下のコマンドを入力すると、ホームディレクトリ配下に .jupyter/jupyter_notebook_config.py という設定ファイルができます。

jupyter lab --generate-config

2.パスワードを設定

Jupyter-labの利用時にパスワードを入力するように設定します。

ipythonで生成させたハッシュ値(’sha’から始まる文字列)をコピーし、先程生成した設定ファイルの”#c.NotebookApp.password = ” “となっている行のクォーテーションの中にコピーしたハッシュ値を貼り付け、行頭の#を削除します。

ipython
from IPython.lib import passwd
passwd()

3.Extentionが使えるようにするためにパッケージインストール

jupyter-labでは様々な拡張機能を使うことができ、それを使うためにnodejsとnpmをインストールします

sudo apt install nodejs npm

Jupyter-lab起動

ターミナルでjupyter-labというコマンドを入力すると、jupyter-labが起動し、ブラウザが立ち上がります。

画面右側の「Notebook」の下にある「Python3」をクリックすると、利用開始です!

終了したいときは、「File」タブの「Shutdown」をクリックしてブラウザを閉じればOK。

サンプル

ちょっと試しに、週ごとの支出の推移と用途別の利用金額割合を表示してみました↓

ただグラフをかいただけでは、あまり意味のあることはわからないですが、簡単に始められそうだというのは伝わるかなと思います。

まとめ

以上、簡単ではありますが、Ubuntu20.04でJupyter-labを始める始め方をメモ程度でお伝えしました。

データ分析は、やってみると面白いのでぜひトライするといいでしょう。やってるうちにいろんなことが少しずつできるようになるものです。

今回使用した「Anaconda」は、大規模な商用利用をするときには有償版を購入しなければいけないので注意が必要です。
ただし、Jupyter-lab単体は商用利用も無償でできるので、仕事で使ってみたい場合は「pip」などを使って個別でインストールするといいでしょう。

最後まで読んでいただき、ありがとうございました!

ではでは〜