#author("2023-11-02T10:06:08+09:00","default:cmdsadmin","cmdsadmin")
* ハンズオン用データ [#s66957f3]
#author("2024-05-07T10:34:41+09:00","default:cmdsadmin","cmdsadmin")

#contents

** データ利用に関する注意 [#gc58a016]
- 本データの利用にあたっては,授業のオリエンテーション時に説明した''データの取り扱い事項''を順守すること
- 本データを''本講座の受講生以外に共有・配布することは厳禁''とします


** アヤメ (Iris) データセット [#mc415245]
- 【出典】[[UC Irvine Machine Learning Repository:https://archive.ics.uci.edu/dataset/53/iris]]
- オリジナルデータをシャッフルして個体番号を付けたもの (UTF-8形式)
-- https://www2.cmds.kobe-u.ac.jp/~masa-n/dshandson/iris-sample.csv
- 【ラベルなしデータ】上記のデータから品種を取り除いたもの(UTF-8形式)
-- https://www2.cmds.kobe-u.ac.jp/~masa-n/dshandson/iris-sample-nolabel.csv

** 迷惑メール (spam-base) データセット [#u4f884fd]
- 【出典】[[UC Irvine Machine Learning Repository:https://archive.ics.uci.edu/dataset/94/spambase]]
- オリジナルデータに日本語でデータ項目を付けたもの(UTF-8)
-- https://www2.cmds.kobe-u.ac.jp/~masa-n/dshandson/spam-sample.csv


** 不動産データセット [#o0b3640c]
- 【出典】[[UC Irvine Machine Learning Repository:https://archive.ics.uci.edu/dataset/477/real+estate+valuation+data+set]]
- オリジナルデータに日本語でデータ項目を付けたもの(UTF-8)
-- https://www2.cmds.kobe-u.ac.jp/~masa-n/dshandson/realestate-sample.csv

** シェアサイクルデータセット [#t9aeb698]
- 【出典】[[UC Irvine Machine Learning Repository:https://archive.ics.uci.edu/dataset/275/bike+sharing+dataset]]
-- 日別データ: https://www2.cmds.kobe-u.ac.jp/~masa-n/dshandson/bike-sharing-day.csv
--- 欠損値・外れ値入り: https://www2.cmds.kobe-u.ac.jp/~masa-n/dshandson/bike-sharing-unclean.csv
-- 時間別データ: https://www2.cmds.kobe-u.ac.jp/~masa-n/dshandson/bike-sharing-hour.csv

//** ドイツの信用リスク (credit-g) データセット [#zb8e0e1d]
//- 【出典】[[Open ML:https://www.openml.org/search?type=data&sort=runs&status=active&id=31]]
//- オリジナルデータに日本語でデータ項目を付けたもの(UTF-8)
//-- https://www2.cmds.kobe-u.ac.jp/~masa-n/dshandson/credit-g.csv


** SSDSE-家計消費(SSDSE-C)データセット [#x2a1f458]
- 【出典】 [[SSDSE(教育用標準データセット):https://www.nstac.go.jp/use/literacy/ssdse/#SSDSE-C]]
-- https://www2.cmds.kobe-u.ac.jp/~masa-n/dshandson/SSDSE-C-2023.csv
-- 文字コード:CP932

** 神戸の気象データ2022年10月~2023年9月 [#ve3d3dee]
- 【出典】[[気象庁:https://www.data.jma.go.jp/stats/data/mdrr/index.html]]
-- https://www2.cmds.kobe-u.ac.jp/~masa-n/dshandson/kobe_weather_202210_202309.csv
-- 文字コード:UTF-8

** 卸売業者(Wholesale customers)データセット [#fba1d3b3]
- 【出典】[[UC Irvine Machine Learning Repository:https://archive.ics.uci.edu/dataset/292/wholesale+customers]]
-- https://www2.cmds.kobe-u.ac.jp/~masa-n/dshandson/wholesale_customers.csv

//** 模擬試験データセット [#r33ab49f]
//- 【出典】生成データ
//- 模擬試験5科目の成績と,本番入試の合否がラベルになっているデータ
//-- https://www2.cmds.kobe-u.ac.jp/~masa-n/dshandson/exam-sample.csv
//-- 【クリーニング後】 https://www2.cmds.kobe-u.ac.jp/~masa-n/dshandson/exam-sample-cleaned.csv

** 5教科テストデータセット [#s7babc29]
- 【出典】人工データ (中村)
- 国語,数学,英語,物理,化学の点数100人分のデータ
-- https://www2.cmds.kobe-u.ac.jp/~masa-n/dshandson/exam-pca.csv
-- CSV形式,文字コードUTF-8

** ヨーグルトの売り上げデータ [#t3f682d0]
- 【出典】人工データ (中村)
-- https://www2.cmds.kobe-u.ac.jp/~masa-n/dshandson/yogurt.xlsx
-- エクセル形式 (xlsx)


トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS