Ano ang AWS data lake?
Ano ang AWS data lake?

Video: Ano ang AWS data lake?

Video: Ano ang AWS data lake?
Video: Back to Basics: Building an Efficient Data Lake 2024, Mayo
Anonim

A lawa ng data ay isang bago at lalong popular na paraan upang mag-imbak at magsuri datos dahil pinapayagan nito ang mga kumpanya na pamahalaan ang marami datos mga uri mula sa isang malawak na iba't ibang mga mapagkukunan, at iimbak ito datos , structured at unstructured, sa isang sentralisadong repositoryo.

Sa ganitong paraan, ang AWS s3 ba ay isang lawa ng data?

Amazon S3 Data Lakes Amazon S3 ay walang limitasyon, matibay, nababanat, at cost-effective para sa pag-iimbak datos o paglikha mga lawa ng data . A lawa ng data sa S3 maaaring gamitin para sa pag-uulat, analytics, artificial intelligence (AI), at machine learning (ML), dahil maaari itong ibahagi sa buong AWS malaki datos ecosystem.

Bukod pa rito, bakit pinipili ng mga customer ang Amazon s3 para buuin ang kanilang data lake? Sa Amazon S3 , ikaw pwede cost-effective na magtayo at sukat a lawa ng data ng anumang sukat sa isang ligtas na kapaligiran kung saan ang data ay protektado ng 99.999999999% (11 9s) ng tibay. meron ka rin ang kakayahang umangkop sa gamitin ang iyong ginustong analytics, AI, ML, at mga application ng HPC mula sa ang Amazon Partner Network (APN).

Kaugnay nito, ano ang pagkakaiba sa pagitan ng isang data warehouse at isang data lake?

Mga lawa ng data at datos Ang mga bodega ay parehong malawak na ginagamit para sa pag-iimbak ng malaki datos , ngunit hindi sila maaaring palitan ng mga termino. A lawa ng data ay isang malawak na pool ng raw datos , ang layunin kung saan hindi pa natukoy. A bodega ng data ay isang repository para sa structured, na-filter datos na naproseso na para sa isang partikular na layunin.

Ano ang gamit ng data lake?

A lawa ng data ay karaniwang isang solong tindahan ng lahat ng negosyo datos kabilang ang mga hilaw na kopya ng source system datos at binago data na ginamit para sa mga gawain tulad ng pag-uulat, visualization, advanced analytics at machine learning.

Inirerekumendang: