第1回Python3データ分析模擬試験【第40問】解説

プライム・ストラテジー株式会社 2021年04月26日 08時00分 [ プライム・ストラテジー株式会社のプレスリリース一覧 ]

プライム・ストラテジー株式会社は「第1回Python3データ分析模擬試験【第40問】解説」を公開しました。

＃＃＃

本問題では「scikit-learn」のうち、教師なし学習の典型的タスクの1つであるクラスタリングと、そのアルゴリズムである階層的クラスタリング（凝集型・分割型）や、非階層的クラスタリングのk-meansについてについて学びます。

■問題

クラスタリングに関する次の記述のうち、誤っているものはどれか。

① クラスタリングは、ある基準を設定してデータ間の類似性を計算し、データをクラスタ（グループ）にまとめるタスクであり、教師なし学習の典型的なタスクである。

② 凝集型の階層的クラスタリングは、まず似ているデータをまとめて小さなクラスタを作り、次にそのクラスタと似ているデータをまとめ、最終的にデータが1つのクラスタにまとめられるまで処理を繰り返すクラスタリング手法である。

③ 分割型の階層的クラスタリングは、最初にすべてのデータが1つのクラスタに所属していると考え、順次クラスタを分割していくアプローチであり、一般的に凝集型に比べて計算量が少なく精度が高いためよく用いられる。

④ k-meansは最初にランダムにクラスタ中心を割り当て、クラスタ中心を各データとの距離を計算しながら修正し、最終的なクラスタ中心が収束するまで再計算を行いクラスタリングする手法である。

⑤ k-meansは、scikit-learnのclusterモジュールのKMeansクラスを用いることによって実行することができる。

解説と回答は以下をご覧ください
リンク

デジタル製品主要記事

ソニー、2人でも楽しめるネックスピーカー--形状記憶用素材で首にぴったりフィット

第1回Python3データ分析模擬試験【第40問】解説

プライム・ストラテジー株式会社は「第1回Python3データ分析模擬試験【第40問】解説」を公開しました。

デジタル製品主要記事

ZDNET Japan 注目ヘッドライン

編集部おすすめの記事

読まれている記事