データ型とは?なぜ適切なデータ型が必要なのか?Power Queryによるデータ変換方法

Excel
この記事は約3分で読めます。
こまちゃん
こまちゃん

読み込んだデータから売上の集計をしたいんだけど

なぜか上手く計算できない・・・

なまけもん
なまけもん

もしかしたらデータ型が適切でないのかも?

データ型を変換してみて

データ分析におけるデータ型とは?

データ型とは?

データ型(Data type)とは、コンピュータプログラミングや計算機科学において、属性を持つデータを分類し、その扱われ方をコンパイラやインタープリタに知らせるプログラム (Wikipedia)

データ型を正しく定義してあげることで、コンピュータはそのデータが何であるかを正しく理解することができます。

データ型が大切な理由

  1. データの整合性
    • 「43677」というデータがあった場合、データ型によって認識される内容が異なります
      • データ型が「整数」ならデータは「43677」
      • データ型が「日付」なら「2019/07/31」
  2. 正確な計算
    • 例えば「10」というデータに「+10」とする場合、データ型で結果が異なってくる可能性があります。
      • データ型が「整数」なら「10+10=20」
      • データ型が「テキスト」なら「10+10=1010(+でテキストを連結)」
  3. 最適なパフォーマンス
    • データの型によってもっている情報の量が異なってきます。最適なデータ型を選択することで余計なメモリや計算時間を省くことが期待できます。
なまけもん
なまけもん

適切なデータを選択することで、余分な時間を減らしたり、

エラーの可能性を低くすることが期待できるよ

Power Queryのデータ型の種類

Power Queryには次のような種類のデータ型があります。

Power Queryのデータ型
  • 数値
    • 10進数, 通貨, 整数, パーセンテージ
  • 日付
    • 日付/時刻, 日付, 時刻, 日付/時刻/タイムゾーン, 期間
  • テキスト
  • True / False
  • バイナリ

Power Queryでのデータ型変換のやり方

Power Queryでデータ変換をする方法は非常にシンプルです。

Power Queryエディターの「変換」タブから「データ型」を選択し、変換したいデータ型を選択

データの内容と変換しようとするデータ型があっていない場合は「Error」となるので要注意

<エラー例>名前の入った列を「整数」にデータ変換など

まとめ

データ型はコンピュータプログラミングなどにおいて、属性をもつデータを分類します。

データの整合性を保ち、正確な計算を最適なパフォーマンスで実施するために適切なデータ型を設定することが大切です。

Power Queryでは列を選択して、任意のデータ型を選択することでデータ型の変換を行うことができますが、データ内容に対して選択したデータ型が適切でない場合は「Error」となるため注意が必要です。

適切なデータ型を選択することで、思いがけない集計エラーなどを未然に防ぎましょう

タイトルとURLをコピーしました