課題提出のページを熟読したうえで,以下の演習課題に取り組みなさい
以下では,Pythonソースコードの実践により,教師あり学習・分類の理解を深めよう
Q6-1【乳がんの診断(2値分類)】
# Pandasをインポート import pandas as pd # データを読み込み from sklearn.datasets import load_breast_cancer data_breast_cancer = load_breast_cancer() # 【データ内容】↓ # 説明変数(特徴量データ): data_breast_cancer.data ## mean concave points - 細胞にある凹みの平均個数 ## symmetry error - 細胞の左右の非対称性の度合い ## texture error - 細胞表面の明暗の標準偏差 ## worst radius - 細胞の平均半径 ## ... # 目的変数(正解データ): data_breast_cancer.target ## class - 腫瘍の判定結果(悪性: 0, 良性: 1)
# 特徴量データ x = data_breast_cancer.data # 正解データ t = data_breast_cancer.target # 正解データの次元数を2から1へ t = t.reshape(-1) ## ↑次元削減しければ,Inputデータの次元が合わないとエラーが出る ### A column-vector y was passed when a 1d array was expected
Q6-2【手書き数値の認識(多クラス分類)】
# データを読み込み from sklearn.datasets import load_digits data_digits = load_digits() # 【データ内容】↓ # 説明変数(特徴量データ): data_digits.data ## 図2 (b) のように,正確には画像ではなく数値の配列である ## 一つの手書き数字は,1チャネルで表される(モノクロ画像) ## 一つの手書き数字は,8×8のサイズで構成され,1次元の配列に格納されている ### (横向きにスライスした画像を一列につなげるイメージで,64個の数値 の配列から構成される) # 目的変数(正解データ): data_digits.target ## class - 手書き数値の判定結果(0~9中の一つ)
Q6-3【分類モデルの性能を更に上げてみよう】
※それぞれモデルにパラメータを図3の赤線のように指定しなさい
作成したところまでのプログラムのipynbファイルを提出しなさい