データクリーニングのチェックリスト | 好ましいクリーニング方法 | データクリーニングのモットー |
–データセットの大きさ -カテゴリーやラベルの数 -欠落しているデータ -フォーマットされていないデータ-異なるデータ型 | –COUNTIFでイレギュラーの情報の数を数える -LNEで文字列の数字数を数える -LEFTやRIGHT、MIDで文字列を切り出す -TIRMで不要なスペースを削除する -SPLITで文字列を分割する | –すべてのデータが同じではないため、同じように扱ってはいけない。 –物事が計画通りに進まないことを覚悟すべし。代替案を用意すること。 –単純な問題に複雑な解決策を当てはめないこと。 |
データクリーニング・アプローチ
