第1回Python3データ分析模擬試験【第40問】解説

プライム・ストラテジー株式会社は「第1回Python3データ分析模擬試験【第40問】解説」を公開しました。

###

本問題では「scikit-learn」のうち、教師なし学習の典型的タスクの1つであるクラスタリングと、そのアルゴリズムである階層的クラスタリング(凝集型・分割型)や、非階層的クラスタリングのk-meansについてについて学びます。

■問題

クラスタリングに関する次の記述のうち、誤っているものはどれか。

① クラスタリングは、ある基準を設定してデータ間の類似性を計算し、データをクラスタ(グループ)にまとめるタスクであり、教師なし学習の典型的なタスクである。

② 凝集型の階層的クラスタリングは、まず似ているデータをまとめて小さなクラスタを作り、次にそのクラスタと似ているデータをまとめ、最終的にデータが1つのクラスタにまとめられるまで処理を繰り返すクラスタリング手法である。

③ 分割型の階層的クラスタリングは、最初にすべてのデータが1つのクラスタに所属していると考え、順次クラスタを分割していくアプローチであり、一般的に凝集型に比べて計算量が少なく精度が高いためよく用いられる。

④ k-meansは最初にランダムにクラスタ中心を割り当て、クラスタ中心を各データとの距離を計算しながら修正し、最終的なクラスタ中心が収束するまで再計算を行いクラスタリングする手法である。

⑤ k-meansは、scikit-learnのclusterモジュールのKMeansクラスを用いることによって実行することができる。

解説と回答は以下をご覧ください
リンク

本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]