Jadual Kandungan
Apakah itu AWS Glue?
Apakah perangkak AWS Glue?
Apakah Katalog Data Glue?
Mengapa menggunakan Amazon Athena dan AWS Glue?
4 kes penggunaan Amazon Athena utama
3 kes penggunaan Gam AWS kunci
Bermula dengan AWS Glue: Cara mendapatkan data daripada AWS Glue ke Amazon Athena
Rumah pangkalan data SQL Cara menggunakan perangkak AWS Glue dengan Amazon Athena

Cara menggunakan perangkak AWS Glue dengan Amazon Athena

Oct 22, 2024 am 10:33 AM
sql

Sebagai seorang profesional data, anda berurusan dengan sejumlah besar data daripada a pelbagai sumber. Ini boleh menjadikan pengurusan dan analisis data a cabaran. Nasib baik, dua perkhidmatan AWS boleh membantu: AWS Glue dan Amazon Athena. 

Apabila anda menyepadukan perkhidmatan ini, anda membuka kunci potensi penuh penemuan data, pengkatalogan dan pertanyaan dalam ekosistem AWS. Jom lihat cara mereka boleh menyelaraskan aliran kerja analitis data anda.

Cara menggunakan perangkak AWS Glue dengan Amazon Athena

Apakah itu AWS Glue?

Gam AWS ialah perkhidmatan terurus tanpa pelayan yang membolehkan anda menemui, menyediakan, bergerak, dan menyepadukan data daripada pelbagai sumber. Sebagai penyepaduan data perkhidmatan, AWS Glue memberi anda kuasa untuk mengurus data secara terpusat lokasi tanpa perlu mengurus infrastruktur.

Apakah perangkak AWS Glue?

Glue perangkak ialah alat penemuan data automatik yang mengimbas data sumber untuk mengelaskan, mengumpulkan dan mengkatalogkan data di dalamnya secara automatik. Ia kemudian mencipta baharu atau mengemas kini jadual sedia ada dalam Data Glue AWS anda Katalog.

Apakah Katalog Data Glue?

Katalog Data Glue AWS ialah indeks lokasi data anda, skema, dan metrik masa jalan. Anda memerlukan maklumat ini untuk mencipta dan pantau kerja ekstrak, ubah dan muat (ETL) anda. 

Mengapa menggunakan Amazon Athena dan AWS Glue?

Sekarang kita telah membincangkan asas Amazon Athena, AWS Glue dan AWS Perangkak gam, mari bercakap tentangnya dengan lebih mendalam.

4 kes penggunaan Amazon Athena utama

Amazon Athena menyediakan cara yang mudah dan fleksibel untuk menganalisis petabait data tepat di tempat mereka tinggal. Sebagai contoh, Athena boleh menganalisis data atau bina aplikasi daripada Perkhidmatan Penyimpanan Mudah Amazon (S3) tasik data dan 30 sumber data, termasuk sumber data di premis atau sistem awan lain menggunakan SQL atau Python. 

Terdapat empat kes penggunaan Amazon Athena utama:

  1. Jalankan pertanyaan pada S3, pusat data di premis atau pada awan lain 

  2. Sediakan data untuk model pembelajaran mesin

  3. Gunakan model pembelajaran mesin dalam pertanyaan SQL atau Python untuk memudahkan tugas yang kompleks, seperti pengesanan anomali, kohort pelanggan analisis dan ramalan jualan

  4. Lakukan analitik berbilang awan (seperti pertanyaan data dalam Azure Sinaps Analitis dan kemudian memvisualisasikan hasil dengan Amazon QuickSight)

3 kes penggunaan Gam AWS kunci

Sekarang kita telah membincangkan Amazon Athena, mari bercakap tentang AWS Glue. Anda boleh melakukan beberapa perkara berbeza dengan AWS Glue. 

Pertama, anda boleh menggunakan enjin penyepaduan data AWS Glue, yang membolehkan anda untuk mendapatkan data daripada beberapa sumber yang berbeza. Ini termasuk Amazon S3, Amazon DynamoDB, dan Amazon RDS, serta pangkalan data yang berjalan di Amazon EC2 (yang disepadukan dengan studio AWS Glue) dan AWS Glue untuk Ray, Python Shell, dan Apache Spark. 

Setelah data diantara muka dan ditapis supaya ia boleh berinteraksi dengannya tempat untuk memuatkan atau membuat data, senarai ini berkembang untuk memasukkan data daripada tempat seperti Amazon Redshift, tasik data dan gudang data.

Anda juga boleh menggunakan AWS Glue untuk menjalankan kerja ETL anda. Pekerjaan ini membolehkan anda untuk mengasingkan data pelanggan, melindungi data pelanggan dalam transit dan di berehat, dan akses data pelanggan hanya seperti yang diperlukan sebagai tindak balas kepada pelanggan permintaan. Apabila menyediakan pekerjaan ETL, anda hanya perlu menyediakan sumber data input dan sasaran data output dalam peribadi maya anda awan.

Cara terakhir anda boleh menggunakan AWS Glue adalah melalui katalog data untuk cepat menemui dan mencari beberapa set data AWS tanpa mengalihkan data. Setelah data dikatalogkan, ia segera tersedia untuk carian dan pertanyaan menggunakan Amazon Athena, Amazon EMR dan Amazon Redshift Spektrum.

Bermula dengan AWS Glue: Cara mendapatkan data daripada AWS Glue ke Amazon Athena

Jadi, bagaimanakah anda boleh mendapatkan data daripada AWS Glue ke dalam Amazon Athena? Ikut langkah ini:

  1. Mulakan dengan memuat naik data ke sumber data. Yang paling popular pilihan ialah baldi S3, tetapi jadual DynamoDB dan Amazon RedShift juga pilihan. 

  2. Pilih sumber data anda dan buat pengelas jika perlu. Pengelas membaca data dan menjana skema jika ia mengenali format. Anda boleh membuat pengelas tersuai untuk dilihat jenis data yang berbeza. 

  3. Buat perangkak. 

  4. Sediakan nama untuk perangkak, kemudian pilih sumber data anda dan tambahkan sebarang pengelas tersuai untuk memastikan AWS Glue mengenali data dengan betul.

  5. Sediakan peranan Pengurusan Identiti dan Akses (IAM) untuk memastikan perangkak dapat menjalankan proses dengan betul.

  6. Buat pangkalan data yang akan menyimpan set data. Tetapkan masa dan kekerapan perangkak berfungsi untuk memastikan data anda sentiasa segar dan terkini.

  7. Jalankan perangkak. Proses ini boleh mengambil sedikit masa bergantung kepada betapa besarnya set data. Setelah perangkak berjaya dijalankan, anda akan melakukannya lihat perubahan pada jadual dalam pangkalan data.

Sekarang anda telah menyelesaikan proses ini, anda boleh melompat ke Amazon Athena dan jalankan pertanyaan yang anda perlukan untuk menapis data dan dapatkan hasil yang anda cari.


Atas ialah kandungan terperinci Cara menggunakan perangkak AWS Glue dengan Amazon Athena. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Tutorial PHP
1592
276
Apakah jenis data gumpalan dan clob dalam SQL? Apakah jenis data gumpalan dan clob dalam SQL? Aug 07, 2025 pm 04:22 PM

Blobstoresbinarydatalikeimages, audio, orpdfsasrawbyteswithoutcharacterencoding, whileClobstoreslargetextsuchasarticlesorjsonusingcharacterencodinglikeutf-8andsupportsstringsstrings;

Bagaimana untuk mencari jumlah lajur dalam SQL? Bagaimana untuk mencari jumlah lajur dalam SQL? Aug 08, 2025 pm 05:54 PM

Fungsi tofindthesumofacolumninsql, usethesum (), yang mana -mana yang tidak dapat diterangkan;

Bagaimana untuk mendapatkan hari pertama dan terakhir tahun ini di SQL? Bagaimana untuk mendapatkan hari pertama dan terakhir tahun ini di SQL? Aug 11, 2025 pm 05:42 PM

ThefirstdayOfheyearisobtaintainTaTaThtainTyConstrtruncatingToJanuary1stofthegivenyear, andthelastdayisdecember31stofthesameyear, withmethodsvaryingbydatabasesystem;

Cara menyertai meja dengan sendirinya di SQL Cara menyertai meja dengan sendirinya di SQL Aug 16, 2025 am 09:37 AM

Aself-joinisusedtocomparerowswithinthesametable,suchasinhierarchicaldatalikeemployee-managerrelationships,bytreatingthetableastwoseparateinstancesusingaliases,asdemonstratedwhenlistingemployeesalongsidetheirmanagers'nameswithaLEFTJOINtoincludetop-lev

Memahami konteks dan kebenaran pelaksanaan SQL Memahami konteks dan kebenaran pelaksanaan SQL Aug 16, 2025 am 08:57 AM

Konteks pelaksanaan SQL merujuk kepada identiti atau peranan ketika menjalankan pernyataan SQL, yang menentukan keizinan sumber dan operasi mana yang dapat diakses. Tetapan kebenaran harus mengikuti prinsip kebenaran minimum, dan keizinan umum termasuk pilih, memasukkan, melaksanakan, dan lain -lain untuk menyelesaikan masalah kebenaran, anda perlu mengesahkan nama log masuk, keizinan peranan, tetapan pelaksanaan dan kebenaran skema. Melaksanakan penukaran konteks boleh dilaksanakan melalui ExecuteAs, tetapi perhatian harus dibayar kepada kewujudan pengguna, pemberian kebenaran dan kesan keselamatan prestasi. Adalah disyorkan untuk mengelakkan sewenang -wenangnya memberikan peranan DB_OWNER atau sysadmin. Akaun permohonan hanya perlu mengakses objek yang diperlukan dan diberi kuasa melalui skema.

Apakah pernyataan Alter Table dalam SQL? Apakah pernyataan Alter Table dalam SQL? Aug 08, 2025 pm 02:13 PM

ThealterTableStatementisusedTomodifeanexistingtable'sstructureWithoutrecreatingit; 1.addanewcolumnusingaddcolumn; 2.dropacolumnwithdropcolumn, whoSalsodeletesitsdata;

Cara membuat pandangan dalam SQL Cara membuat pandangan dalam SQL Aug 11, 2025 pm 12:40 PM

Sintaks untuk membuat pandangan ialah pernyataan createViewView_nameasSelect; 2. Pandangan tidak menyimpan data sebenar, tetapi berdasarkan hasil pertanyaan masa nyata dari jadual asas; 3. Pandangan boleh diubahsuai menggunakan CreateOrreplaceView; 4. Pandangan boleh dipadam melalui Dropview; 5. Pandangan ini sesuai untuk memudahkan pertanyaan kompleks, menyediakan kawalan akses data, dan mengekalkan konsistensi antara muka, tetapi perhatian harus dibayar kepada prestasi dan logik, dan akhirnya berakhir dengan ayat lengkap.

Bagaimana untuk menggunakan gabungan luar penuh di SQL? Bagaimana untuk menggunakan gabungan luar penuh di SQL? Aug 17, 2025 am 12:25 AM

Afullouterjoinreturnsallrowsfrombothtables, withnullswherenomatchexists; 1) itcombinesmatchingrecordsandincludesunmatchedrowsfrombothleftandrightTables;

See all articles