ホームページ > テクノロジー周辺機器 > AI > 人気のない意見:良いデータサイエンティストになるのはこれまで以上に難しい

人気のない意見:良いデータサイエンティストになるのはこれまで以上に難しい

PHPz
リリース: 2025-02-26 03:55:10
オリジナル
551 人が閲覧しました

データサイエンスとAIエンジニアリングの進化する風景:課題と機会を見る

生成AI(genai)および大規模な言語モデル(LLM)は、特にデータサイエンス内でプロの世界を再構築しています。 このgenai主導の環境は、意欲的で確立されたデータサイエンティストの両方に前例のない課題をもたらします。この記事では、伝統的なMLとGenaiと協力して6年以上の洞察と経験を共有し、成功したデータサイエンティストの進化する役割に関する視点を提供します。

免責事項:以下の逸話は架空のものになる可能性があります。

?この記事が役立つと思ったら、気に入ってコメントしてください! また、私のブログに元の投稿を見つけることができます。 ?

人気のない意見:データサイエンティストの役割はこれまで以上に厳しいものです。

目次

「良い」データサイエンティストの定義

    チャレンジ#1:高い期待、限られたデータ、戦略
  1. チャレンジ#2:AIの誇大広告と自称専門家
  2. チャレンジ#3:組織全体で一貫性のないデータサイエンスの役割
  3. チャレンジ#4:永続的なデータ品質の問題
  4. チャレンジ#5:ドメインの専門知識の重要なニーズ
  5. チャレンジ#6:「ops」ランドスケープのナビゲート(dataops、mlops、aiops、llmops)
  6. チャレンジ#7:急速な技術の進歩に適応
  7. 考えを結論付けます
  8. 参照
  9. 1。 「良い」データサイエンティストの定義

「深い学習?ここでの学習に焦点を当てています。データエンジニアリングはどこにあるかです。」 -

仮説的な雇用主、2015

私の旅はRとSQLから始まり、北欧の株式市場の動向を分析しました。 私が勉強した最先端の深い学習は、世界を離れて感じました。現在、私の焦点は、LLMS、Genai、およびエージェントワークフローにあり、TypeScriptを使用してGenaiサービスを構築しています。この変化は、従来のML/DLから生成AIおよびLLMSまで、データの専門家に対する期待のより広範な進化を反映しています。 「良い」データサイエンティストの定義が拡大しました。 A/Bテストや統計モデリングから、エンドツーエンド(E2E)MLパイプラインの所有権まで、役割は大きく異なります。 ただし、コアスキルは依然として不可欠です genai時代のV字型データサイエンティスト

(参照[1]を参照)

私の論文は、急速な変化のこの時代に成功するためのV字型のスキルセットを強調しています:

深いAI/mlの専門知識

プログラミングとシステム開発

データエンジニアリング

ビジネスの洞察力

    倫理的考慮事項とガバナンス
  1. この基盤を使用して、現在の課題を探りましょう。
  2. 2。チャレンジ#1:高い期待、限られたデータ、戦略
  3. 「AI、Genai、LLMSが必要です!競合他社はChatGptを使用しています。チャットボットを作成してください! - 仮想マネージャー、2023

    Unpopular Opinion: It’s Harder Than Ever to Be a Good Data Scientistaiは、多くの組織にとって最優先事項です。 ChatGptの台頭は、「AI主導の」ビジネスへの急ぎを促進しました。 LLMS経由でAIを統合するのは簡単ですが、現実は複雑です。

    重要な課題は、期待と現実のギャップを強調しています

      データ不足:
    • 堅牢なデータパイプラインが重要です。データ科学者は、これらのパイプラインを構築するためにデータエンジニアリングリソースを提唱することにしばしば時間を費やします。 さらに、データはしばしば散在し、一貫性がなく、構造が不十分です データ戦略の欠如:
    • データ自体だけでなく、明確な戦略が必要です。 これには、デリケートなデータへの対処、データサイエンスの取り組みをビジネス目標に合わせ、データ駆動型の文化を促進することが含まれます。 これがなければ、データサイエンティストは無関係な問題を解決するか、未使用のソリューションを作成します。
    • AI戦略の欠如:多くの企業は、そのためにAIを採用しています。 定義されたユースケースとROIを使用した明確なAI戦略が不可欠です。
    • これらの課題は、AIイニシアチブを追求する前に、基礎的なサポートの必要性を強調しています。 3。チャレンジ#2:AIの誇大広告と自称専門家

    「ChatGptが2022年後半に発表されました。私は5つの迅速なエンジニアリングコースを受講しました。簡単です!地元のモデルは機能します。 -

    仮想的な非同僚、2024

    AIブームは、自称専門家の急増につながりました。 LLMSを介したAIのコモディティ化は肯定的ですが、専門知識も希薄化します。 迅速なエンジニアリングコースを受講することで、誰かがAIスペシャリストになりません。 この誇大広告は課題を生み出します:

    自称専門家の台頭:Unpopular Opinion: It’s Harder Than Ever to Be a Good Data Scientist自信過剰と真の専門知識の欠如は、進歩を妨げる可能性があります。

    誤ったスキル:

    チームはAIツールスキルを持っている可能性がありますが、モデルを効果的に構築、微調整、展開する専門知識が不足している可能性があります。
    • プラグアンドプレイソリューションへの過度の依存:アクセス可能な場合、これらのソリューションはカスタマイズ、スケーラビリティ、およびセキュリティ/コンプライアンスの懸念に対応することがよくあります。 LLM機能の誤解: LLMSは普遍的なソリューションではありません。 彼らは特定の領域(テキスト生成、要約)で優れていますが、他の領域には不適切です(回帰、時系列)。
    • 4。チャレンジ#3:組織全体で一貫性のないデータサイエンスの役割
    • 「データサイエンティスト?何をしますか? - 仮想的な同僚、2024

      データサイエンティストの役割には明確な定義がありません。 責任は大きく異なります:

      Unpopular Opinion: It’s Harder Than Ever to Be a Good Data Scientist

      製品アナリスト:
        A/Bテスト、ユーザーの動作分析に焦点を当てています。
      • データエンジニア:
      • データパイプラインの構築と維持に焦点を当てています。
      • 機械学習エンジニア:
      • 完全なMLモデルライフサイクルに焦点を当てています。
      • この矛盾は次のとおりです

      未定義の役割:

      求人およびインタビュー中の混乱。
      • スキルの過負荷と燃え尽き:多様な地域に熟練するようにプレッシャー。
      • AIエンジニアリングへのシフト:データサイエンスとソフトウェアエンジニアリングを橋渡しする専門家に対する需要の増加。
      • 就職活動中の明確さは非常に重要です。
      • 5。課題#4:永続的なデータ品質の問題

      「データ、私の友人、敵、パートナー。LLMSを使用して合成データを生成する必要がありますか?」 -

      仮想データサイエンティスト、2024

      ゴミ、ゴミ(ギゴ)は依然として重大な問題のままです。多くの企業が自分のデータを包括的に理解していないため、AIのために効果的に使用する際の課題につながります。

      6。チャレンジ#5:ドメインの専門知識の重要なニーズ

      「あなたは科学者ではありませんか?財政と法律についてすべてを知ってはいけませんか?chatgptを使用してください!」 -

      仮説的なドメインの専門家、2022-2023 Unpopular Opinion: It’s Harder Than Ever to Be a Good Data Scientist

      LLMは強力ですが、深いドメインの専門知識は依然として不可欠です。 ドメインの専門家とのコラボレーションは、次のことに非常に重要です

      コンテキストの理解:データ分析でしばしば欠落しているコンテキストを提供します。

      モデルの微調整:

      モデルが業界標準と一致するようにします Unpopular Opinion: It’s Harder Than Ever to Be a Good Data Scientist

      リスク軽減とコンプライアンス:
        デリケートセクターの規制のナビゲーション。
      • 7。チャレンジ#6:「ops」ランドスケープのナビゲート
      • 「データパイプライン、モデル展開、LLM最適化、クラウドインフラストラクチャ?モデルをトレーニングしたかっただけです!」 -
      • 仮想データサイエンティスト、2024

        Unpopular Opinion: It’s Harder Than Ever to Be a Good Data ScientistAIシステムの運用が重要です。 DataOPS、MLOPS、AIOPS、およびLLMOPSを理解することは、生産展開を成功させるために不可欠です。

        8。チャレンジ#7:迅速な技術の進歩に適応

        「新しいライブラリはスタックと互換性がありませんが、より速いです。私はそれをフィットさせます。」 -

        仮想エンジニアリングマネージャー、2024

        技術の変化の急速なペースは、機会と課題の両方を提示します:

        Unpopular Opinion: It’s Harder Than Ever to Be a Good Data Scientist

        圧倒的なツールの選択:
          適切なツールを選択するのが難しい。
        • フラグメンテーションと統合:
        • さまざまなシステムの統合の課題。
        • 進化するスキルセット:
        • 継続的な学習と適応の必要性。
        • イノベーションと実用性のバランス:
        • 本物のイノベーションを誇大広告と区別します
        • プログラミングの役割の将来:AIのプログラミングタスクを自動化する可能性。
        • 9。結論の考え
        データサイエンスの分野は急速に進化しています。 成功には、技術的な専門知識、ビジネスの洞察力、コラボレーションスキル、継続的な学習へのコミットメントの融合が必要です。

        10。参考文献

        [1] Elwin、M。(2024)。生成AIの時代のV字型データサイエンティスト。

        medium

        。 [元の記事へのリンク] [2-10] [残りの参考文献へのリンク]

以上が人気のない意見:良いデータサイエンティストになるのはこれまで以上に難しいの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート