2. Python 入門¶
機械学習でデータを扱うにあたり、Python や R などのプログラミング言語が広く活用されています。特に Python は、短いコードで膨大なデータを効率的に処理・分析・可視化できるため、その重要性は年々高まっています。
第 2 回の今回は、機械学習に関するプログラミングを学ぶ前に、Python の文法について学んでいきましょう。C 言語を学習済みの皆さんであれば、C に照らして Python のコードを眺めることで、効率よく Python の文法を学ぶことができるはずです。
2.1 Google Colab の導入¶
Google Colaboratory(通称 Google Colab)は、ブラウザ上で Python コードを記述・実行できる無料のクラウドサービスです。環境構築が不要で、Google アカウントさえあればすぐに Python プログラミングを始められます。
2.1.1 Google Colab の特徴¶
- 環境構築不要: Python や主要なライブラリがあらかじめインストールされています
- 無料で利用可能: Google アカウントがあれば誰でも無料で使えます
- GPU が使える: 機械学習の学習に必要な計算資源を無料で利用できます
- Google Drive と連携: ファイルの保存や共有が簡単です
2.1.2 Google Colab の始め方¶
- Google アカウントにログインした状態で Google Colab にアクセス
- 「ファイル」→「ノートブックを新規作成」をクリック
- セル(コードを入力する枠)に Python コードを入力
[Shift] + [Enter]または再生ボタンをクリックしてコードを実行
2.1.3 基本的な使い方¶
Google Colab では、セル という単位でコードを記述・実行します。セルには「コードセル」と「テキストセル」の 2 種類があります。
- コードセル: Python コードを記述・実行するセル
- テキストセル: Markdown 形式で説明文を記述するセル
実行結果は以下の画像のように、セルのすぐ下に表示されます。
Google Colab のショートカットキー
[Shift] + [Enter]: セルを実行して次のセルに移動[Ctrl] + [Enter]: セルを実行して同じセルに留まる[Ctrl] + [F9](または「すべてのセルを実行」ボタン): すべてのセルを実行[Ctrl] + [M] → [B]: 下に新しいセルを追加[Ctrl] + [M] → [A]: 上に新しいセルを追加
2.1.4 ファイルの保存¶
Google Colab で作成したノートブックは、自動的に Google Drive の「Colab Notebooks」フォルダに保存されます。ファイル名を変更するには、画面上部のファイル名をクリックします。
それでは、Google Colab を使って Python の基礎を学んでいきましょう。
2.2 変数と基本データ型¶
Python を含む多くのプログラミング言語において、データは 変数 に格納して扱います。変数とは、さまざまな情報を保存するための入れ物のようなもので、基本的なデータ型に「整数」「浮動小数点数」「文字列」「論理値」があります。
C 言語との主な違い
- 型宣言が不要: Python では変数の型を宣言する必要がなく、代入する値から自動的に型が決定されます(動的型付け)
- セミコロン不要: Python では文末のセミコロン
;が不要です - 論理値の表記: C 言語では
1/0で真偽を表しますが、Python ではTrue/Falseというキーワードを使います(先頭大文字に注意)
2.2.2 基本的な算術演算子¶
数値型のデータは、算術演算子を用いて演算を行うことができます。
| 式 | 演算子 | 説明 |
|---|---|---|
x + y |
加算演算子 | x に y を加えた値 |
x - y |
減算演算子 | x から y を引いた値 |
x * y |
乗算演算子 | x に y を乗じた値 |
x / y |
除算演算子 | x を y で割った値 |
x % y |
剰余演算子 | x を y で割った余り |
x ** y |
べき乗演算子 | x を y 乗した値 |
C 言語の算術演算との違い
C 言語にはべき乗演算子がありません。べき乗を計算するには pow() 関数を使う必要があります。また、Python の除算 / は常に浮動小数点数を返しますが、C言語では整数同士の割り算は整数除算になります。Python で整数除算を行いたい場合は // 演算子を使用します。
インタラクティブモード(対話モード)
Google Colab では、変数や数式を直接打ち込むだけで結果が表示されます。print() 関数を使わなくても、セルの最後の行に書かれた値が自動的に出力されます。
複数の値を表示したい場合は、print() 関数を使う必要があります。
演習 2-1: 変数と演算¶
演習 2-1
- 円周率を
pi = 3.14159として変数に代入し、半径r = 5の円の面積を計算してください - 2つの整数
a = 17とb = 5について、除算/、整数除算//、剰余%の結果をそれぞれ出力してください
解答例
2.3 リストと辞書¶
複数のデータを扱いたいときには、「リスト」 (list) や「辞書」 (dict) といったデータ型を使用します。
2.3.1 リスト¶
リストは、順番のあるデータの集まり です。インデックス(何番目の要素かを表す数字)で参照できることと、変更(追加・削除・更新)ができる性質を持ちます。
C 言語の配列との違い
- C 言語の配列はサイズが固定ですが、Python のリストは動的にサイズを変更できます
- Python では
append()関数で簡単に要素を追加できます - Python では
len()関数でリストの長さを取得できます
2.3.2 辞書¶
辞書は、キーと値がペアとなったデータ構造(順序あり) です。キーを用いることで、値を高速に参照することができます。
C 言語との違い
C言語には辞書型に相当するデータ構造が標準では用意されていません。構造体を使うか、ハッシュテーブルを自分で実装する必要があります。Pythonでは辞書が標準で用意されており、非常に使いやすくなっています。
ほかにも、要素の変更ができない「タプル」 (tuple)や、重複のないデータを扱う「集合」(set) がありますが、はじめのうちは「リスト」と「辞書」だけ扱うことができれば十分です。
演習 2-2: リストと辞書¶
演習 2-2
- リスト
fruits = ["apple", "banana", "orange"]を作成し、"grape"を追加、2番目の要素を出力、要素数を出力してください - 自分の情報を辞書で作成してください(名前、年齢、出身地など3つ以上)。そして名前を出力してください
解答例
# リストの操作
fruits = ["apple", "banana", "orange"]
print(f"初期リスト: {fruits}")
# "grape"を追加
fruits.append("grape")
print(f"追加後: {fruits}")
# 2番目の要素を出力(インデックスは0から始まるので1)
print(f"2番目の要素: {fruits[1]}")
# 出力: 2番目の要素: banana
# 要素数を出力
print(f"要素数: {len(fruits)}")
# 出力: 要素数: 4
# 辞書の作成
my_info = {
"name": "茨城太郎",
"age": 20,
"city": "日立",
"major": "機械システム"
}
# 名前を出力
print(f"名前: {my_info['name']}")
# 出力: 名前: 茨城太郎
# 辞書全体も表示してみる
print(f"全情報: {my_info}")
2.4 if 文(条件分岐)¶
if 文は、条件に応じて処理を分岐させることができる構文です。複数の分岐を作りたい場合は、elif や else を使用します。
C 言語との違い
- インデント(字下げ)が必須: Pythonでは
{}の代わりにインデントでブロックを表します。インデントを揃えないと構文エラーになります - 条件式に括弧が不要: Pythonでは
ifの条件式を()で囲む必要がありません elifキーワード: C言語のelse ifは、Pythonではelifと書きます- コロン
:が必要:if、elif、elseの後には必ずコロン:を付けます
2.4.1 比較演算子¶
| 式 | 説明 |
|---|---|
x < y |
x が y より小さいと True、そうでないと False |
x > y |
x が y より大きいと True、そうでないと False |
x <= y |
x が y 以下であれば True、そうでないと False |
x >= y |
x が y 以上であれば True、そうでないと False |
x == y |
x が y と等しいと True、そうでないと False |
x != y |
x が y と等しくないと True、そうでないと False |
2.4.2 論理演算子¶
| 式 | 説明 |
|---|---|
X and Y |
X と Y がいずれも True であれば True |
X or Y |
X と Y のいずれかが True であれば True |
not X |
X が True であれば False、False であれば True |
C 言語との違い
C言語では論理演算子として &&(AND)、||(OR)、!(NOT)を使いますが、Pythonでは and、or、not という英単語を使います。
演習 2-3: 条件分岐¶
演習 2-3
変数 temperature に気温を、humidity に湿度を代入し、気温が20度以上30度未満、かつ湿度が70%未満のときに "快適" と出力してください。それ以外のときは、適切な文字列を出力してください
解答例
# 気温と湿度の設定(いろいろな値で試してみてください)
temperature = 25
humidity = 60
# 条件分岐
if temperature >= 20 and temperature < 30 and humidity < 70:
print("快適")
elif temperature < 20:
print("寒いです")
elif temperature >= 30:
print("暑いです")
else:
print("湿度が高いです")
# より詳細な判定の例
temperature = 28
humidity = 75
if temperature >= 20 and temperature < 30 and humidity < 70:
print("快適")
else:
# 理由を詳しく出力
reasons = []
if temperature < 20:
reasons.append("気温が低い")
elif temperature >= 30:
reasons.append("気温が高い")
if humidity >= 70:
reasons.append("湿度が高い")
print(f"快適ではありません({', '.join(reasons)})")
# 出力: 快適ではありません(湿度が高い)
2.5 繰り返し処理¶
同じ処理を複数回行うときには、for 文や while 文を使います。
2.5.1 for 文¶
for 文は、リストの中身を 1 つずつ処理する際に、if 文と組み合わせてよく使用されます。
C 言語との違い
for文の書き方が異なる: Pythonではfor 変数 in リスト:という形式で、直接要素を取り出せます。C言語ではfor (初期化; 条件; 更新)という形式でインデックスを使いますrange()関数: Pythonのrange(30)は 0 から 29 までの数値を生成します。C言語ではfor (int i = 0; i < 30; i++)と書く必要があります- f-string: Pythonの
f"{変数}"は文字列内に変数を埋め込む便利な記法です(C言語のprintfのフォーマット指定子に相当)
2.5.2 while 文¶
while 文は、特定の条件を満たす間、同じ処理を繰り返したいときに使用されます。
途中でループを抜け出したいときには break 文、ループの判定に戻りたいときは continue 文を使います。
C 言語との違い
- 条件式の括弧: C言語では
while (条件)と括弧が必要ですが、Pythonではwhile 条件:と括弧なしで書けます breakとcontinue: これらはC言語と同じように使えます
Warning
条件を間違えて無限ループに陥るとプログラムが固まってしまうので注意してください。
演習 2-4: 繰り返し処理¶
演習 2-4
for文を使って、1から10までの整数の合計を計算してください- リスト
numbers = [12, 7, 23, 8, 15, 4, 19]の中から、10以上の数だけを出力してください while文を使って、1から始めて2倍ずつ増やし、1000を超えたら停止するプログラムを作成してください
解答例
# 1. 1から10までの合計を計算
total = 0
for i in range(1, 11): # 1から10まで(11は含まない)
total += i
print(f"1から10までの合計: {total}")
# 出力: 1から10までの合計: 55
# 2. 10以上の数だけを出力
numbers = [12, 7, 23, 8, 15, 4, 19]
print("10以上の数:")
for num in numbers:
if num >= 10:
print(num)
# 出力: 12, 23, 15, 19
# リスト内包表記を使う方法
over_10 = [num for num in numbers if num >= 10]
print(f"10以上の数(リスト): {over_10}")
# 3. 1から始めて2倍ずつ増やし、1000を超えたら停止
value = 1
print("2倍ずつ増やす:")
while value <= 1000:
print(value)
value *= 2
print(f"最後の値(1000超): {value}")
# 出力: 1, 2, 4, 8, 16, 32, 64, 128, 256, 512
# 最後の値(1000超): 1024
2.6 関数¶
何度も使う可能性のある一連の処理は、関数 にまとめることで、プログラムをスッキリ整理することができます。関数は def 関数名(引数): といった形で定義し、return で結果を返します。慣れないうちは、無理に関数を使わなくても全く問題ありません。慣れてきたら、より洗練されたプログラムにするために、関数を使うことを検討してください。
// 足し算を行う関数
int add(int a, int b) {
return a + b;
}
printf("%d\n", add(3, 5)); // 8
// 3 の倍数かどうかを判定する関数
int is_3x(int n) {
return n % 3 == 0;
}
printf("%d\n", is_3x(42)); // 1 (True)
// 配列の平均値を計算する関数
float calc_average(int numbers[], int length) {
int sum = 0;
for (int i = 0; i < length; i++) {
sum += numbers[i];
}
return (float)sum / length;
}
int nums[] = {10, 20, 30, 40};
printf("%.1f\n", calc_average(nums, 4)); // 25.0
C 言語との違い
- 戻り値と引数の型宣言が不要: Pythonでは関数定義時に型を宣言する必要がありません
defキーワード: Pythonではdefで関数を定義します(C言語は戻り値の型から始まる)- コロン
:とインデント: Python では関数定義の後にコロンを付け、関数本体をインデントで表します - 配列の長さ: Pythonのリストは長さの情報を持っているため、引数として長さを渡す必要がありません
より包括的な概念として クラス がありますが、これもはじめのうちは意識しなくて問題ありません。
演習 2-5: 関数¶
演習 2-5
- 2つの数の最大値を返す関数
max_value(a, b)を作成してください - リストを引数として受け取り、リスト内の偶数の個数を返す関数
count_even(numbers)を作成してください - 整数
nを引数として受け取り、nの階乗を計算する関数factorial(n)を作成してください
解答例
# 1. 最大値を返す関数
def max_value(a, b):
if a > b:
return a
else:
return b
# テスト
print(max_value(10, 25)) # 出力: 25
print(max_value(100, 50)) # 出力: 100
# 別解: 三項演算子を使う方法
def max_value2(a, b):
return a if a > b else b
# 2. 偶数の個数を数える関数
def count_even(numbers):
count = 0
for num in numbers:
if num % 2 == 0:
count += 1
return count
# テスト
test_numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
print(f"偶数の個数: {count_even(test_numbers)}")
# 出力: 偶数の個数: 5
# 別解: リスト内包表記とlen関数を使う方法
def count_even2(numbers):
return len([num for num in numbers if num % 2 == 0])
# 3. 階乗を計算する関数
def factorial(n):
result = 1
for i in range(1, n + 1):
result *= i
return result
# テスト
print(f"5の階乗: {factorial(5)}") # 出力: 5の階乗: 120
print(f"3の階乗: {factorial(3)}") # 出力: 3の階乗: 6
print(f"10の階乗: {factorial(10)}") # 出力: 10の階乗: 3628800
# 別解: 再帰を使う方法
def factorial_recursive(n):
if n <= 1:
return 1
return n * factorial_recursive(n - 1)
print(f"5の階乗(再帰): {factorial_recursive(5)}")
2.7 ライブラリの使い方¶
Python では多くの便利な機能が「ライブラリ」として提供されています。指す対象の広さに応じて「パッケージ」「モジュール」とも呼ばれますが、便利なツール群ということで言葉の違いはあまり気にしなくても問題ありません。いずれも import 文で使います。
C 言語との違い
importvs#include: Pythonではimport、C言語では#includeでライブラリを読み込みます- エイリアス: Pythonでは
import ... as ...で長い名前を短縮できます。C言語にはこの機能はありません - 豊富なライブラリ: Pythonは標準で豊富なライブラリが用意されており、データ分析や機械学習に特化したライブラリも簡単に利用できます
この例のように、import ... as ... とすることで、長いライブラリ名やモジュール名を省略することができます。as を使わずに使用することもできますが、matplotlib.pyplot なんて毎回書いていられないので、plt にして簡潔にしているというわけです。
なお、ここで例にあげた 3 つのライブラリ(numpy, pandas, matplotlib) はデータ分析における三種の神器とも呼ばれ、この 3 つだけで基本的なデータ分析の 8 割をカバーできるといっても過言ではありません。
それぞれの詳しい使い方については、第 2 回目以降で説明します。
2.8 総合演習¶
総合演習 2-1: FizzBuzz¶
総合演習 2-1
1~50 までの数を順番に表示し、3 の倍数のときは数字の後ろに「!」、5 の倍数のときは数字の後ろに「?」、両方の倍数なら数字の後ろに「!?」をつけるプログラムを作成してください。
解答例
# FizzBuzzプログラム
for i in range(1, 51): # 1から50まで
if i % 3 == 0 and i % 5 == 0:
print(f"{i}!?")
elif i % 3 == 0:
print(f"{i}!")
elif i % 5 == 0:
print(f"{i}?")
else:
print(i)
# 別解: 15の倍数を先にチェック
print("\n--- 別解 ---")
for i in range(1, 51):
if i % 15 == 0: # 3と5の最小公倍数
print(f"{i}!?")
elif i % 3 == 0:
print(f"{i}!")
elif i % 5 == 0:
print(f"{i}?")
else:
print(i)
# 別解: 文字列を結合する方法
print("\n--- 別解2 ---")
for i in range(1, 51):
output = str(i)
if i % 3 == 0:
output += "!"
if i % 5 == 0:
output += "?"
print(output)
出力例(最初の20個):
総合演習 2-2: 数当てゲーム¶
総合演習 2-2
1から100までのランダムな整数を生成し、ユーザーに数を当ててもらうゲームを作成してください。
要件:
import randomを使い、random.randint(1, 100)でランダムな数を生成- ユーザーの入力は
input()で受け取る(int(input("数字を入力: "))のように使う) - ユーザーの予想が正解より大きければ "もっと小さい数です" と表示
- ユーザーの予想が正解より小さければ "もっと大きい数です" と表示
- 正解したら "正解です!◯回で当たりました!" と表示してゲーム終了
ヒント: while 文で繰り返し、if 文で条件分岐、変数で試行回数をカウントします。
解答例
import random
# 1から100までのランダムな整数を生成
answer = random.randint(1, 100)
attempts = 0
print("=== 数当てゲーム ===")
print("1から100までの数を当ててください!")
while True:
# ユーザーからの入力を受け取る
try:
guess = int(input("数字を入力: "))
attempts += 1
# 予想と正解を比較
if guess < answer:
print("もっと大きい数です")
elif guess > answer:
print("もっと小さい数です")
else:
print(f"正解です!{attempts}回で当たりました!")
break
except ValueError:
print("エラー: 整数を入力してください")
attempts -= 1 # エラーの場合は試行回数をカウントしない
# ゲーム終了後のメッセージ
if attempts <= 5:
print("素晴らしい!")
elif attempts <= 10:
print("まぁまぁの結果です!")
else:
print("もう少し頑張りましょう!")
実行例:
