Excelを使ったサンプルデータセットの作り方
目次
この記事を読んだ人がよくダウンロードしている資料
はじめに
5月より入社した安達と申します。将棋好きなので、社内では羽生と呼ばれています。主にデータ分析をメインに業務しておりますが、今後ともよろしくお願いします。
今回はExcelを使ったサンプルデータセットの作り方をお伝えします。
sum、average、Vlookupなどの他にも様々な便利な関数が用意されているExcelですが、みなさんはRAND関数を使ったことはありますか?
データセットとは
データセットとは、アバウトに言えば、表形式でまとめられたデータ群の事で、会社の売上に関するデータやお客様の購買データ、社員の給与の一覧データなど様々存在します。普段からExcelを使っている方、分析している方はイメージしやすいと思います。
実は最近弊社のあるプロジェクトにて、サンプルのデータセットを作る工程が生じ、Excelを使って簡単にデータセットを作ることができたので、その作り方を紹介します。
当記事について
この記事は以下のような場面で参考になると思います。
- Excelでの分析業務を行う際に、工程途中の計算においてエラーや予想外の値が出ないか確認したい
- 社内向け説明資料において、サンプルデータセットを使ってより正確な説明がしたい
実践前の説明
Excelを使って分析やデータの加工をする時に、「この計算結果が反映されるか?」「新しいデータが入ってきた時にしっかり反映されるか?」といったお悩みを持った事がありませんか。そんな時は、計算で使用するセルで数値を打ち直してみたり、ある行まるまる仮の数値を打ち込んだりして対応されると思います。
1行1行手作業で数値を打ち込んでの検算・検証、結構面倒ですよね。
今回紹介するのは、RAND関数・RANDBETWEEN関数を使って簡単にサンプルのデータを作るやり方です。
まずはこちらの写真をご覧ください。
とあるEC企業からヒアリングしたアンケートのサンプルデータだと思って見てください。
A列からG列は数値データ、H列からM列は「1」~「4」で回答されるアンケートデータとなっています。アンケートの内容は置いておいて、6つの設問に対して、それぞれ1という回答が「頑張っている」→4が「頑張っていない」という選択式の回答になっていると想定してください。
これらのデータを元に、御社のノウハウを使った顧客診断をしたいというプロジェクトを始めたいとします。ただサンプル1つだけの顧客では、様々なケースに対応できないことが想定されます。そこでサンプルデータセットを作り、エラーが発生しないかなどをチェックしていきたいのです。
実際に弊社では「EC売上成長余地診断」というプロジェクトを作りリリースしたところです。
実践
さてそれでは実際にExcelを使って、サンプルデータセットを作っていきましょう。
データセットの作り方を、実際にExcelを操作している動画を元に、次のステップで解説します。
- 使用する関数を確認
- 実際に関数を使ってみる
- 関数を使ってサンプルデータセットを作成する
使用する関数を確認
まずは使用する関数を確認しましょう。
動画で紹介しているExcelの関数は以下の5点です。
▼関数 | ▼返り値 |
RAND関数 | 0~1の範囲でランダムの数値を返す |
RANDBETWEEN関数 | 引数で指定の範囲でランダムの数値を返す |
INT関数 | 小数を正数に変えてくれる |
ROUND関数 | 値を丸めてくれる。引数で指定した桁数のところで丸めてくれる |
LEN関数 | 値や文字列の数を返す(小数点の場合は要注意) |
実際に関数を使ってみる
次に、テスト形式で関数の使い方を確認しましょう。
以下のような問題を解いていくことで、それぞれの関数の使い方を身につけていきます。
- RAND関数を使って0~1のランダム値を取得してください
- RANDBETWEEN関数を使って、1~500のランダム値を取得して下さい
- RANDBETWEEN関数を使って、アンケート回答用の1~4のランダム値を取得して下さい
- 顧客の新規か既存のシェア率は0~1(100%)の範囲です。まずは新規の割合をランダムで取得してください
- 4の回答に合わせて、既存の割合を求めてください。
- 広告経由のサイト流入率は、0~1の値を取りますが、1に近い値というより0.5に近い値を取りそうです
- 年間売上は顧客によって様々です。1000万〜100億の数値を取得してみましょう
- 問題7の値をROUND関数を使って数値を丸めてみましょう
関数を使ってサンプルデータセットを作成
ここまで解説してきた関数を使って、実際にこれらの関数を使ってサンプルデータセットを作ってみましょう。
まとめ
いかがでしたでしょうか。手間のかかる作業を一瞬で解決できましたね。
また、RAND系の関数だと、他にRANDARRAY関数というのもあるみたいですね!気になる方はぜひ調べて見てください。
弊社instagramアカウントでは私安達が様々な公開データを使ってデータ分析しています。どうぞフォローください。
https://www.instagram.com/kuroco_official/
\ この記事を読んでいる人におすすめ! /