Ano ang Data Catalog AWS?
Ano ang Data Catalog AWS?

Video: Ano ang Data Catalog AWS?

Video: Ano ang Data Catalog AWS?
Video: Getting Started with AWS Glue Data Catalog 2024, Abril
Anonim

Ang AWS pandikit Catalog ng Data ay isang sentral na imbakan upang mag-imbak ng structural at operational metadata para sa lahat ng iyong datos mga ari-arian. Para sa isang naibigay datos set, maaari mong iimbak ang kahulugan ng talahanayan nito, pisikal na lokasyon, magdagdag ng mga nauugnay na katangian ng negosyo, pati na rin subaybayan kung paano ito datos ay nagbago sa paglipas ng panahon.

Isinasaalang-alang ito, ano ang AWS glue data catalog?

Ang Catalog ng Data ng AWS Glue naglalaman ng mga sanggunian sa datos na ginagamit bilang mga source at target ng iyong extract, transform, at load (ETL) na mga trabaho sa AWS Glue . Karaniwan, nagpapatakbo ka ng isang crawler upang kumuha ng imbentaryo ng datos sa iyong datos mga tindahan, ngunit may iba pang mga paraan upang magdagdag ng mga talahanayan ng metadata sa iyong Catalog ng Data.

Sa tabi sa itaas, maaaring itakda sa AWS glue? AWS Glue ay walang server, kaya walang imprastraktura itakda up o pamahalaan. Ikaw pwede gamitin din ang AWS Glue Ang mga pagpapatakbo ng API upang mai-interface AWS Glue mga serbisyo. I-edit, i-debug, at subukan ang iyong Python o Scala Apache Spark ETL code gamit ang isang pamilyar na development environment.

Ang dapat ding malaman ay, ano ang data catalog?

A katalogo ng datos ay isang tool sa pamamahala ng metadata na idinisenyo upang tulungan ang mga organisasyon na mahanap at pamahalaan ang malaking halaga ng datos – kabilang ang mga talahanayan, file at database – na nakaimbak sa kanilang ERP, human resources, finance at e-commerce system pati na rin ang iba pang source tulad ng mga social media feed.

Ano ang gamit ng AWS glue?

AWS Glue ay isang ganap na pinamamahalaang extract, transform, at load (ETL) na serbisyo na ginagawang madali para sa mga customer na ihanda at i-load ang kanilang data para sa analytics. Maaari kang lumikha at magpatakbo ng isang ETL na trabaho sa ilang mga pag-click sa AWS Management Console.

Inirerekumendang: