ページ内移動リンク
職業について、内容、就労する方法、求められる知識・スキルや、どのような人が向いているかなどが総合的にわかるサイトです
膨大なデータを分析するためにデータの整理や管理を行ったり、複雑で大規模なデータが活用できるよう情報基盤の構築や運用を行う。 情報化が進展した今日、膨大なデータ(ビッグデータ)が蓄積され、利用・活用されるようになっている。また、AI(人工知能)も様々な場面で応用が進んでいるが、その実用化のためには大量のデータが必要となる。このような膨大なデータを扱うエンジニアである。 データエンジニアに似た職業にデータサイエンティストがある。データサイエンティストがデータを分析し、新たな商品やサービスを生み出したり、業務プロセスを革新する知見を引き出すのに対し、データエンジニアはこのためのデータの収集、整理、管理、そして情報基盤の構築や運用を行う。 また、データエンジニアとは呼ばれていなかったが、システムエンジニアの中にはデータの収集と整理に関する開発、また、データを活用するための情報基盤の構築と運用を行う人も居り、この人達もデータエンジニアと同じような仕事をしていたといえる。そして、データエンジニアの中で分析に特化し、専門性を高めていきデータサイエンティストとなったり、機械学習に特化しAIエンジニアになっていく人もいる。データエンジニアとシステムエンジニア、データサイエンティスト、AIエンジニアの関係をこのように整理することもできる。 データエンジニアの具体的な業務としては以下の3つがある。 第一に、データはそのままでは利用できないことが多く、欠損しているデータを補ったり、データの重複を整理したり、表記の揺れ(サーバーとサーバ、西暦と和暦、年齢区分、centerとcentre等々)などを統一する作業であり、分析できるようデータを整理、加工する業務である。データをグラフ等で見やすく視覚化する業務もこの中に含まれる。また、データの整理、加工のためにプログラムを作成することもある。 第二に、データを収集し、蓄積し、利用できるような情報基盤を設計し、構築する業務である。具体的には、IoTなどにより集まってくる膨大なデータからデータベースを作成し、データサイエンティストやデータを分析する人が必要な形で取り出せるよう、情報インフラを開発する業務である。近年では、膨大なデータを廉価に効率的に格納し、利用するためにクラウドサービスを利用することが多い。この場合、データエンジニアはクラウド上にデータを蓄積し、利用する情報システムを開発、運用する。また、最近、各種センサーやカメラ、IoTを駆使したスマート工場が話題になるが、このような工場の情報システムを開発するのもデータエンジニアである。 第三に、AI(人工知能)開発における「教師データ」の作成がある。AIに学習させるためには「教師データ」が必要であり、そのデータを作成する。データを整理し、データを整える業務である。このデータ整理のためにプログラムを作成することもある。AIを運用しその結果から、教師データを作り直すこともある。 ◇ よく使う道具、機材、情報技術等 文書作成ソフト(Word、一太郎等)、表計算ソフト(Excel、スプレッドシート等)、パソコン
掲載している職業情報について(ご意見募集など)
特集:IT・通信の仕事
[ 動画 ]
グラフの目盛り
データはありません
※厚生労働省が2023年度に実施した委託調査結果に基づき掲載(結果の概要はこちら)
新卒採用では理工系の大学、大学院の者が多いが、文系でも心理学や経済学等データを扱っていた卒業生も多い。高専や専門学校の情報系の卒業生もいる。システムエンジニアとして一括して新卒採用し、その中からデータエンジニアとして育てていく会社もある。 中途採用の場合、システムエンジニア等IT関係のエンジニアから転職という人が多い。また、製造、金融、医療、教育等、何らかの分野に詳しい業務知識を持っていると中途採用では有利となる。 資格関連では民間が運営する海外のものがあり(Google認定プロフェッショナルデータエンジニア、CCP データエンジニア認定試験等)、この認定を持っているとデータエンジニアのスキルがあると国の内外で評価される。 データエンジニアそのものの資格ではないが、情報処理振興機構(IPA)のデータベーススペシャリスト試験、システムアーキテクト試験などは関連する知識を持っている証明となる。 総務省、文部科学省、経済産業省、内閣府、厚生労働省が後援し、日本統計学会が認定する、一般財団法人 統計質保証推進協会が実施している「統計検定」も関連する知識の検定となっている。 新卒採用の場合、入社後、社内で必要に応じて、基礎スキルの研修(プログラミング、数学、データ分析、データベース、分散処理、機械学習、AI(人工知能)等)、業務知識の習得(データの背景を把握するための顧客の業務の理解等)、プロジェクトのマネジメント(チーム管理やアジャイル開発)等の研修を行う会社もある。開発のスピードアップが求められる今日、以前のウォーターフォール型でない、アジャイル開発のスキルが求められている。 このような研修を受け、その後は社内でプロジェクトに参加し、仕事をしながら、また、関連するKaggle等のコミュニティに参加し、力をつけていく。KaggleとはそのトップページにYour Machine Learning and Data Science Communityとあるように、世界中の機械学習とデータサイエンスに携わる数十万人が集まるコミュニティである。 この後のキャリアとしてはプロジェクトのマネジメントをし、さらにグループのマネジメントをするようになるというように管理職的なキャリアを歩む人と、専門性を高めエキスパートになっていく人がいる。専門性を高め、データサイエンティストやAIエンジニアになる人もいる。 データエンジニアに必要なスキルとしては、微分積分、線形代数、確率統計などの数学のスキル、Python、Java、Rなどのプログラミングのスキル、Scala(スカラ)等を使ってデータを可視化するスキル、ビッグデータを分析する環境をアマゾン、マイクロソフト、グーグルなどのクラウドサービスでデータベースを設計、構築し、運用するスキルが求められる。また、スマート工場など社内で情報インフラを構築する場合、センサーやIoTの知識、サーバやネットワークなどを設計、構築し、運用するスキル、Hadoopなどによる大規模なデータを分散処理する知識などが求められる。そしてAI開発が盛んな今日、機械学習の知識が求められる場合もある。また、データを扱う上では対象分野の業務知識が非常に重要である。業務知識が無ければ、どのようなデータでどのように処理すれば良いかが分からない。技術動向や社会、経済の動きを把握していることも必要である。 膨大で複雑なデータを丹念に処理していく必要があることから、根気があり、粘り強いことが求められる。データの分析では自分の思い込みがないか、自分の考えを客観的にとらえられることも必要である。技術や分析に対する好奇心、新しい手法を積極的に取り入れるチャレンジ精神も求められる。
関連資格
関連する資格はありません
この職業で実際に働いている人が多いと感じる『学歴』を表しています。必須とは限りませんので、詳細は「就業するには」を確認してください。
この職業で実際に働いている人が必要と考える入職前の訓練等の期間(学歴を除く)を表します。必須とは限りませんので、詳細は「就業するには」を確認してください。
この職業で実際に働いている人が必要と考える入職前の実務経験の期間を表します。必須とは限りませんので、詳細は「就業するには」を確認してください。
この職業に就いた後に、周囲から特別なサポートが無くても他の一般的な就業者と同じように働けるようになるまでに必要な期間を表します。あくまで一般論ですので、職歴等により差があります。
情報システムの企画、構築、運用などの業務を一括して請け負う会社であるシステムインテグレーター(System Integrator、略してSIer)やスマート工場他を持つメーカーで働いている人が多いが、中小のデータ分析の専門会社で働いている人もいる。 基本的には自社で勤務し、作業自体はほぼPCだけでできることから、テレワークなど自宅で作業を行うこともできる。機密性のある顧客データを扱う場合、自社において厳密な入退室管理が行われている部屋で作業を行う。また、顧客の拠点で作業を行うこともある。顧客との打合せ、結果報告等のため客先を訪問することもある。 この職業の就業者に関する統計等は無いが、前述のコミュニティの参加者等から日本で数万人居ると考えられる。この中には肩書はシステムエンジニアであるが、実質的にはデータエンジニアの仕事をしているという人も含まれる。フリーランスは少なく、会社の正社員として働いている人が大半である。このコミュニティの参加者から30歳代が多く、次いで40歳代が多い、男女の比率としては7:3から8:2程度と考えられる。 収入面や労働時間はシステムエンジニアとあまり変わらないが、ビッグデータの利用・活用が広がり、仕事が多くなっている反面、スキルの高い人材は少ないことから高給の人もいる。 今日、産業、社会の広範なデジタル化、IoT(モノのインターネット)、デジタルトランスフォーメーション(DX)など、データの活用が益々、拡大している。一方、専門的な知識、高度なスキルを有する人材は不足しており、仕事には事欠かない状況が続くと考えられる。
データエンジニアが属する主な職業分類(厚生労働省編職業分類の「その他の情報処理・通信技術者(ソフトウェア開発を除く)」等)に対応する統計情報です。
※「統計データ」は、必ずしもその職業のみの統計データを表しているものではありません。各統計データで使用されている職業分類の詳細については職業分類対応表をご覧ください。
※各統計データに関する留意事項についてはこちらをご覧ください。
※関連団体等が別途就業者数等を公表している場合は「労働条件の特徴」本文中に記載されていることがあります。
就業者統計データ
就業者数
(出典:令和2年国勢調査の結果を加工して作成)
労働時間
(出典:令和5年賃金構造基本統計調査の結果を加工して作成)
賃金(年収)
年齢
賃金分布(グラフ)※全国のみ
スキルレベル別給与データ(年収)
〈設計・構築〉
ITSSレベル1~2
ITSSレベル3
ITSSレベル4
ITSSレベル5以上
※金額は第一四分位から第三四分位の範囲を表しています。
ハローワーク求人統計データ
求人賃金(月額)
(令和5年度)
有効求人倍率
この職業で実際に働いている人が多いと感じる『就業形態』を表しています。
データエンジニアが属する産業(情報通信業)の産業別景況動向をグラフで見ることができます。(産業全体の景況動向はこちら)
グラフの数値が大きいほど、労働者が不足と判断している。
情報通信業のグラフを見る
グラフの数値が大きいほど、景気が上昇と予測している。
残業時間(時間外労働時間)や有給休暇取得率、平均年齢など、企業の様々な職場情報を検索・比較したい方はこちら(クリックすると別サイトのしょくばらぼへ移り、 データエンジニアが属する産業(情報通信業)で検索ができます)
各数値の詳細解説ページはこちら
どのようなスキルがどの程度必要かを職業間で比較可能な形で表しています。前職や自分自身のスキルと比較することができます。
どのような分野の知識が重要であり、必要かを表しています。前職や自分自身の知識と比較し、不足する分野を特定することができます。
どのようなアビリティがどの程度必要かを職業間で比較可能な形で表しています。前職や自分自身のアビリティと比較することができます。
仕事の場所や対人業務の頻度などの、職場環境や仕事の内容などを表しています。
関連するリンクはありません