Me pēhea te hono atu a Apache Spark ki Databricks?

Whakahōu whakamutunga: 19/08/2023

Ko te whainga o tenei tuhinga ko te whakarato i tetahi aratohu hangarau mo te hono a Apache Spark ki nga Databricks. I roto i te ao o te rorohiko me te puiao raraunga, kua noho a Apache Spark tetahi o nga taputapu rongonui mo te tukatuka me te tātari i nga pukapuka nui o nga raraunga. I tetahi atu taha, ko Databricks te turanga rangatira i roto i te kapua mo te tukatuka raraunga nui me te tātari kaha. Ko te hono i waenga i enei punaha kaha e rua ka whai paanga nui ki te kaha, te whakahiato, me te mahinga o nga kaupapa tātari raraunga. I roto i tenei tuhinga, ka tirotirohia e matou nga huarahi rereke me nga whakaaro hangarau hei whakarite i te hononga maeneene me te whai hua i waenga i a Apache Spark me Databricks. Mena kei te pirangi koe ki te arotau i o rerenga mahi tātari raraunga me te whakanui i nga rauemi e waatea ana, maau tenei tuhinga.

1. Whakataki ki te hononga i waenga i a Apache Spark me Databricks

Ko te hononga i waenga i a Apache Spark me Databricks he mea nui mo te hunga e hiahia ana ki te whai rawa i te mana o nga punaha e rua. Ko Apache Spark he anga mahi tukatuka i roto i te mahara e taea ai te tātari raraunga nui-nui, ko te Databricks he papahanga tātari me te mahi tahi i hangaia kia mahi tahi me Spark. I tenei wahanga, ka tirotirohia e matou nga tikanga o tenei hononga me te pehea e whai hua ai nga taputapu e rua.

Hei timata, he mea nui ki te whakaatu ko te hononga i waenga i a Apache Spark me Databricks i hangaia ma te whakamahi i Ngā API motuhake. Ka whakaratohia e enei API he atanga ngawari ki te whakamahi ki te taunekeneke me Spark mai i nga Databricks me te rereke. Ko tetahi o nga huarahi tino noa ki te whakapumau i tenei hononga ma te Databricks Python API, ka taea e koe te tuku me te whiwhi raraunga i waenga i nga punaha e rua.

I te wa kua whakapumautia te hononga, he maha nga mahi ka taea te mahi ki te tino painga ki te mana o Spark me Databricks. Hei tauira, ka taea e koe te whakamahi i te Anga Raraunga me nga mahi SQL o Spark ki te mahi i nga patai uaua mo nga raraunga kua rongoa ki te Databricks. I tua atu, ka taea te whakamahi i te Nga whare pukapuka korakora ki te mahi i nga mahi tātaritanga matatau, penei i te tukatuka kauwhata, i te ako miihini ranei.

2. Te whirihora i a Apache Spark kia hono atu ki nga Databricks

Hei whirihora i a Apache Spark me te hono atu ki nga Databricks, he maha nga waahanga me whai koe. Anei he aratohu taipitopito hei awhina i a koe ki te whakaoti i tenei raru:

1. Tuatahi, kia mohio kua whakauruhia e koe a Apache Spark ki to miihini. Mena kaore ano koe i a koe, ka taea e koe te tango mai i te paetukutuku Apache rangatira me te whai i nga tohutohu whakauru kia rite ki ia tō pūnaha whakahaere.

2. I muri mai, me tango me te whakauru i te Apache Spark Connector mo nga Databricks. Ma tenei hononga ka taea e koe te whakarite hononga i waenga i nga mea e rua. Ka kitea e koe te hononga i roto i te putunga Databricks i GitHub. Ina oti te tango, me taapiri atu ki to whirihoranga kaupapa Spark.

3. Na, me whirihora e koe to kaupapa Spark ki te hono atu ki a Databricks. Ka taea e koe tenei ma te taapiri i nga rarangi waehere e whai ake nei ki to tuhinga Spark:

from pyspark.sql import SparkSession
spark = SparkSession.builder 
    .appName("Mi App de Spark") 
    .config("spark.databricks.service.url", "https://tu_url_de_databricks") 
    .config("spark.databricks.service.token", "tu_token_de_databricks") 
    .getOrCreate()

Ko enei rarangi waehere ka tautuhi i te tohu urunga URL me nga Databricks mo to kaupapa Spark. Kia kaha ki te whakakapi your_databricks_url me te URL o to tauira Databricks me your_databricks_token me to tohu whakaurunga Databricks.

3. Ma te taahiraa: me pehea te whakatu hononga i waenga i a Apache Spark me Databricks

Hei whakarite hononga angitu i waenga i a Apache Spark me Databricks, he mea nui kia ata whai i nga mahi e whai ake nei:

  1. Hipanga 1: Takiuru ki tō pūkete Databricks ka hanga he kāhui hōu. Me kowhiria e koe te putanga hou o Apache Spark e tautokohia ana e to kaupapa.
  2. Hipanga 2: I roto i te whirihoranga tautau, kia mohio ki te whakahohe i te kōwhiringa "Whakaaetia te Uru o waho" ki te tuku hononga mai i te Spark.
  3. Hipanga 3: I roto i to taiao rohe, whirihorahia te Spark kia taea ai te hono atu ki nga Databricks. Tenei Ka taea te mahi ma te whakarato i te URL huinga me nga tohu i roto i te waehere whirihoranga.

Kia oti enei mahi, kua rite koe ki te whakatu hononga i waenga i a Apache Spark me Databricks. Ka taea e koe te whakamatautau i te hononga ma te whakahaere waehere tauira e panui ana i nga raraunga mai i tētahi kōnae i roto i te Databricks me te mahi i etahi mahi taketake. Mena kua angitu te hononga, me kite koe i nga hua o te mahi i roto i te putanga Spark.

4. Te whirihora i te motuhēhēnga i waenga i a Apache Spark me Databricks

Ko te whakamotuhēhē he āhuatanga nui i te wa e whakarite ana i te whakaurunga haumaru i waenga i a Apache Spark me Databricks. I tenei pou, ka whakamaramahia e matou nga huarahi e tika ana hei whirihora tika i te motuhēhēnga i waenga i enei waahanga e rua.

1. Tuatahi, he mea nui ki te whakarite kua whakauruhia e koe a Apache Spark me Databricks ki to taiao whanaketanga. Kia whakauruhia, kia mohio kei te whirihora tika nga waahanga e rua me te rere pai.

2. I muri mai, me whirihora e koe te motuhēhēnga i waenga i a Apache Spark me Databricks. Ka taea tenei ma te whakamahi i nga whiringa whakamotuhēhēnga rereke, penei i te whakamahi i nga tohu motuhēhēnga, te whakauru ranei ki nga kaiwhakarato tuakiri o waho. Hei whakamahi i nga tohu motuhēhēnga, me whakaputa e koe he tohu i roto i te Databricks me te whirihora i roto i to waehere Apache Spark.

He ihirangi motuhake - Paatohia ki konei  Me pēhea te tāpiri i ngā kanohi ki Instagram

3. Kia whirihorahia te motuhēhēnga, ka taea e koe te whakamatautau i te whakaurunga i waenga i a Apache Spark me Databricks. Hei mahi i tenei, ka taea e koe te whakahaere tauira waehere me te manatoko ka tukuna tika nga hua i waenga i nga waahanga e rua. Mena ka pa ki a koe etahi raruraru, kia mohio koe ki te tirotiro i o tautuhinga motuhēhēnga me te whai tika i nga taahiraa.

5. Te whakamahi i nga API Databricks hei hono atu ki a Apache Spark

Ko tetahi o nga huarahi tino whai hua ki te whai hua mai i nga Databricks ko te whakamahi i ana API ki te hono atu ki a Apache Spark. Ko enei API ka taea e nga kaiwhakamahi te taunekeneke ki a Spark kia pai ake te mahi me te mahi i nga mahi tukatuka raraunga matatini kia ngawari ake.

Hei whakamahi i nga API Databricks me te hono atu ki a Apache Spark, he maha nga waahanga hei whai. Tuatahi, me whakarite he putea Databricks me tetahi roopu mahi kua whakaritea. I muri mai, me whakauru tatou i nga whare pukapuka me nga whakawhirinakitanga e tika ana kia mahi tahi me Spark. Ka taea tenei ma te whakamahi i te kaiwhakahaere kete a Python, te pip, me etahi atu taputapu hanga kete me te whakahaere. Ina whakauruhia nga whakawhirinaki, ka rite taatau ki te timata.

I muri i te whakarite i te taiao, ka taea e taatau te whakamahi i nga API Databricks. Ka taea e enei API te taunekeneke ki a Spark na roto i nga momo reo hotaka, penei i te Python, R, Scala ranei. Ka taea e matou te tuku patai ki a Spark, te panui me te tuhi i nga raraunga mai i nga punaa rereke, te whakahaere whakarara i nga mahi Spark, me te maha atu. I tua atu, ka whakarato a Databricks i nga tuhinga maha me nga akoranga hei awhina i a maatau ki te whakamahi i enei API me te whakatau i nga take tukatuka raraunga. whai hua.

6. Uru ki te whakahaere matua mo te hononga i waenga i a Apache Spark me Databricks

He mea nui ki te whakarite i te haumarutanga raraunga me te tūmataiti. Kei raro nei he tukanga taipitopito taahiraa i te taahiraa me pehea te whakaoti i tenei raru.

1. Hangaia he kī uru: Ko te mahi tuatahi ko te whakaputa i te taviri uru ki te Databricks. Ka taea tenei ma te UI Databricks, ma te whakamahi ranei i te API e rite ana. He mea nui ki te whiriwhiri i tetahi kupuhipa haumaru me te mahara ki te penapena ki tetahi waahi haumaru.

2. Whirihorahia te Spark ki te whakamahi i te kī uru: I te wa i hangaia ai te taviri uru, me whirihora e koe a Apache Spark hei whakamahi. Ka taea tenei ma te taapiri i te whirihoranga e whai ake nei ki to waehere Spark:

spark.conf.set("spark.databricks.username", "your-username")
spark.conf.set("spark.databricks.password", "your-password")

3. Whakatūria te hononga: Ina oti te whirihora a Spark, ka taea te hono ki te Databricks ma te whakamahi i te paatene uru i hangaia i runga ake nei. Ka taea tenei ma te hanga tauira o te karaehe 'SparkSession' me te tohu i te URL Databricks, tohu uru me etahi atu whiringa e tika ana.

7. Haumarutanga me te whakamunatanga i roto i te whakawhitiwhiti korero i waenga i a Apache Spark me Databricks

He mea nui ki te tiaki i te pono o nga raraunga me te aukati i nga urunga kore mana. I roto i tenei tuhinga, ka hoatu e matou ki a koe he aratohu taahiraa-i-te-taahiraa kia pai ai te whakawhitiwhiti korero i waenga i enei papaaho e rua.

Hei timata, he mea nui ki te whakarite kia tika te whirihora a Apache Spark me Databricks ki te whakamahi SSL/TLS ki te whakamuna i te whakawhitiwhiti korero. Ka taea tenei ma te whakaputa me te whakauru i nga tiwhikete SSL ki nga pito e rua. Kia noho nga tiwhikete, he mea nui kia taea te motuhēhēnga tahi, e whakarite kia whakamotuhēhēhia e te kiritaki me te tūmau tetahi ki tetahi i mua i te whakaturanga hononga. Ka awhina tenei ki te aukati i nga whakaeke kino tangata-i-waenganui.

Ko tetahi atu waahanga haumaru nui ko te whakamahi i nga papaahi me nga roopu haumaru ki te aukati i te uru ki nga ratonga Apache Spark me Databricks. He mea tika ki te whirihora i nga ture paahi ahi ka taea anake te uru mai i nga wahitau IP pono. I tua atu, ko te whakamahi i nga roopu haumaru ki te whakahaere ko wai nga wahitau IP motuhake ka uru ki nga ratonga ka taea hoki te mahi pai. Ka awhina tenei ki te aukati i nga ngana uru kore mana i runga i te whatunga.

8. Te aro turuki me te tuhi i nga huihuinga i te hononga i waenga i a Apache Spark me Databricks

Hei aroturuki me te tuhi i nga huihuinga i roto i te hononga i waenga i a Apache Spark me Databricks, he rereke nga taputapu me nga tikanga e taea ai te aroturuki taipitopito o nga mahi me te rapu raruraru ka taea. whai hua. Anei etahi tohutohu me nga mahi pai:

1. Whakamahia te rangitaki takahanga Apache Spark: Ka whakarato a Apache Spark i te punaha takiuru whakaurunga e tuhi ana i nga korero taipitopito mo nga mahi me nga huihuinga i mahia i te wa e mahia ana nga mahi. He tino whai hua tenei rangitaki mo te tautuhi i nga hapa me te arotau i nga mahi a te punaha. Ka taea te whirihora i te taumata takiuru kia rite ki nga hiahia motuhake o te kaupapa.

He ihirangi motuhake - Paatohia ki konei  Me pehea te whakawhiti whakaahua mai i te waea pūkoro ki te PC ma te Bluetooth.

2. Whakahohehia nga rangitaki Databricks: Kei te tuku ano hoki a Databricks i tana ake punaha takiuru, ka taea te tiki atu korero mo te hononga ki a Apache Spark. Ka taea e nga raarangi Databricks te awhina ki te tautuhi i nga take e pa ana ki te papaaho me te whakarato i te tirohanga tino pai o nga huihuinga ka puta i te wa e mahia ana.

3. Whakamahia etahi atu taputapu aroturuki: I tua atu i nga rekoata kua hangaia i roto i te Apache Spark me nga Databricks, kei reira nga taputapu aroturuki o waho hei awhina i te aro turuki me te arotau i te hononga i waenga i nga punaha e rua. Ko etahi o enei taputapu e tuku ana i nga kaha matatau, penei i te ine maataki i te wā tūturu, te aroturuki mahi me te kaha ki te whakaputa matohi mo nga huihuinga nui. Ko etahi taputapu rongonui ko Grafana, Prometheus, me DataDog.

9. Te arotautanga mahi i te hononga i waenga i a Apache Spark me Databricks

Ki te arotau i te mahi o te hononga i waenga i a Apache Spark me Databricks, he mea tika ki te whai i nga raupapa o nga waahanga ka pai ake te pai o te punaha i te nuinga. Ko etahi o nga rautaki tino whai hua hei whakatutuki i tenei whainga ka korerohia i raro nei.

1. Whirihoranga rauemi: He mea nui ki te whakarite kia tika te whirihora i nga rauemi e waatea ana ki a Apache Spark me Databricks. Kei roto i tenei ko te toha nui te mahara, te PTM, me te rokiroki kia pai ai te mahi. I tua atu, e taunaki ana kia whakamahia nga miihini mariko mahi teitei me te whakatika i nga tawhā whirihoranga kia rite ki nga hiahia motuhake.

2. Whakahaerenga pounamu: Ko te tautuhi me te whakatau i nga kohanga pounamu he mea nui ki te whakapai ake i nga mahi. Ko etahi tikanga hei whakatutuki i tenei ko te whakamahi keteroki, te whakarara mahi, me te arotautanga patai. He pai hoki ki te whakamahi i nga taputapu aroturuki me te tātari hei tautuhi i nga ngoikoretanga kei roto i te punaha.

3. Te whakamahi i nga tikanga arotautanga matatau: He maha nga tikanga arotautanga ka taea te whakamahi hei whakapai ake i te mahinga o te hononga i waenga i a Apache Spark me Databricks. Kei roto i enei ko te wehewehe tika o nga raraunga, te whakamahi i nga algorithms pai ake, te whakakore i nga raraunga, me te arotau i te kaupapa rokiroki. Ko te whakatinana i enei tikanga ka nui ake te whakapai ake i te tere me te pai o te punaha.

10. Te whakamahi i nga whare pukapuka hototahi mo te hononga i waenga i a Apache Spark me Databricks

Ko te hononga i waenga i a Apache Spark me Databricks he mea nui ki te arotau i te mahinga o nga tono raraunga nui i roto i te kapua. Waimarie, he maha nga wharepukapuka hototahi hei whakahaere i tenei whakaurunga me te tuku i nga kaiwhakawhanake ki te whai rawa i nga kaha o nga punaha e rua.

Ko tetahi o nga whare pukapuka rongonui ki te hono i a Apache Spark me Databricks ko spark-databricks-hono. Ka whakaratohia e tenei whare pukapuka he API ngawari me te pai ki te taunekeneke me nga tautau Spark i runga i nga Databricks. Ka taea e nga kaiwhakamahi te whakahaere tika i nga patai Spark ki Databricks, tiritiri ripanga me nga tirohanga i waenga i nga pukatuhi Spark me nga Databricks, me te uru atu ki nga raraunga kei roto i nga punaha o waho penei i te S3, Azure Blob Storage ranei. I tua atu, ko te spark-databricks-connect he ngawari ki te heke i te waehere Spark o naianei ki te Databricks me te kore e hiahiatia he huringa nui.

Ko tetahi atu waahanga tino whai hua ko te toa pukapuka Delta Lake, e whakarato ana i te paparanga tangohanga taumata-tiketike ki runga i te rokiroki raraunga i Databricks. Ka tukuna e Delta Lake te mana putanga matatau, nga whakawhitiwhitinga ACID, me nga waahanga whakahaere aahua aunoa, he tino ngawari te whakawhanaketanga me te tiaki i nga tono raraunga nui. I tua atu, he hototahi a Delta Lake ki a Apache Spark, ko te tikanga ko nga raraunga kua rongoa ki Delta Lake ka taea te uru tika mai i Spark ma te whakamahi i nga API Spark noa.

11. Te torotoro i nga raraunga i roto i nga Databricks ma te whakamahi i te Apache Spark

He tino mahi tenei ki te wetewete me te mohio ki nga raraunga o raro. I roto i tenei tuhinga, ka whakaratohia e matou he akoranga taahiraa-i-taahiraa mo te whakahaere i tenei torotoro raraunga, ma te whakamahi i nga momo taputapu me nga tauira mahi.

Hei tiimata, he mea nui kia mohio ko Databricks he papaaaaata raraunga-a-kapua e whakamahi ana i a Apache Spark hei miihini tukatuka. Ko te tikanga ka taea e tatou te whakamahi i nga kaha o Spark ki te mahi i nga torotoronga pai me te whakawhanui i o tatou huinga raraunga.

Ko tetahi o nga mahi tuatahi ki te tirotiro i nga raraunga i roto i te Databricks ko te tuku i a maatau raraunga ki te papaahi. Ka taea e tatou te whakamahi i nga momo puna raraunga, penei i nga konae CSV, nga papaunga raraunga o waho, ara te roma-waahi ranei. Kia utaina a maatau raraunga, ka taea e taatau te tiimata ki te mahi i nga mahi torotoro rereke, penei i te tiro i nga raraunga, te whakamahi i nga whiriwhiringa me nga whakahiatotanga, me te tautuhi i nga tauira, i nga kohikohiko ranei.

12. Me pehea te tukutahi me te tukurua i nga raraunga i waenga i a Apache Spark me Databricks

Ko Apache Spark me Databricks e rua nga taputapu rongonui mo te tukatuka me te tarai i nga pukapuka nui o nga raraunga. Engari me pehea e taea ai e tatou te tukutahi me te tukurua i nga raraunga i waenga i enei papaaho e rua? huarahi whai hua? I roto i tenei tuhinga ka tirotirohia e matou nga tikanga me nga tikanga rereke hei whakatutuki i tenei tukutahitanga.

Ko tetahi huarahi ki te tukutahi me te tukurua i nga raraunga i waenga i a Apache Spark me Databricks kei te whakamahi Apache Kafka. Ko Kafka he papaa korero kua tohatohahia e taea ai e koe te tuku me te whiwhi raraunga i roto i te waa tuuturu. Ka taea e tatou te whirihora i tetahi node Kafka i runga i te Spark me te Databricks me te whakamahi i nga kaihanga Kafka me nga kaihoko ki te tuku me te whiwhi raraunga i waenga i enei papaaho e rua.

He ihirangi motuhake - Paatohia ki konei  Me pehea te tiki i te CURP me te Ingoa Pure

Ko tētahi atu kōwhiringa ko te whakamahi Delta Lake, he paparanga whakahaere raraunga kei runga ake o Spark and Databricks. Kei te Delta Lake etahi atu mahi hei whakahaere i nga ripanga me nga raraunga kia pai ake. Ka taea e tatou te hanga ripanga Delta me te whakamahi i te Delta tuhi me te panui i nga mahi ki te tukutahi me te taapiri i nga raraunga i waenga i te Spark me te Databricks. I tua atu, kei te tuku a Delta Lake i nga ahuatanga penei i te whakahaere putanga me te whakarereke i te hopu raraunga, kia ngawari ki te tukutahi me te tukurua i nga raraunga i te waa tuuturu.

13. Ko nga whakaaro whakahiato i te hononga i waenga i a Apache Spark me Databricks

I roto i tenei waahanga ka korerohia e matou nga whakaaro nui hei whai whakaaro ki te arotau i te tauineine i te hononga i waenga i a Apache Spark me Databricks. He mea nui enei whakaaro ki te whakarite i te mahi pai me te whakanui i te kaha o enei taputapu kaha e rua. Kei raro nei etahi tohutohu whaitake:

1. Te whirihoranga tautau tika: Mo te tauineine tino pai, he mea nui ki te whirihora tika i to kohinga Databricks. Ka whai wāhi atu ki te whakatau i te rahi o te kōpuku tika, te maha o ngā kōpuku, me te tohatoha rauemi. I tua atu, he mea nui ki te whai whakaaro ki te whakamahi i nga tauira me te kaha ki te tauine-aunoa ki te urutau ki te whakarereke i nga tono kawenga mahi.

2. Whakarara me te wehewehe raraunga: Ko te whakarara he take matua mo te tauineine o Apache Spark. E taunaki ana kia tika te wehewehe i o raraunga kia pai ai te kaha o te tukatuka toha. Ka whai waahi tenei ki te wehewehe i nga raraunga ki nga wehewehenga me te tohatoha kia rite ki waenga i nga kohinga o te kohinga. Hei taapiri, he mea nui ki te whakarite i te tawhā whakarara a Spark kia pai ai te tohatoha o nga mahi.

3. Te whakamahi pai o te mahara me te rokiroki: Ko te whakapai ake i te mahara me te rokiroki he mea nui kia pai ai te mahi. E taunaki ana kia whakanuia te whakamahinga mahara ma nga tikanga penei i te tohenga raraunga-a-roto me te rahi o te keteroki. Hei taapiri, he mea nui kia whai whakaaro ki te whakamahi i nga punaha rokiroki e tika ana, penei i te HDFS me nga punaha rokiroki kapua, kia pai ai te uru ki nga raraunga i roto i te taiao tohatoha.

14. He wheako mo nga keehi pono mo te hononga angitu i waenga i a Apache Spark me Databricks

I tenei waahanga, ka whakaatuhia etahi keehi tuuturu e whakaatu ana i te hononga angitu i waenga i a Apache Spark me Databricks. Ma enei tauira, ka maarama nga kaiwhakamahi me pehea te whakatinana i tenei whakaurunga ki a raatau ake kaupapa.

Ko tetahi o nga keehi whakamahi e aro ana ki te whakamahi i te Apache Spark mo te tātari raraunga tuuturu. Ma tenei tauira e whakaatu me pehea te hono atu i a Apache Spark me nga Databricks ki te tango painga i te mana tukatuka me te rokiroki kapua. Ka whakauruhia he akoranga taahiraa-i-te-taahiraa mo te whakarite me te whakamahi i enei taputapu, whakarato ngā tohutohu me ngā tinihanga mo te hononga angitu.

Ko tetahi atu take tino hei whakanui ko te whakauru o Apache Spark me Databricks mo te whakatinanatanga o nga tauira ako miihini. Ka whakamaramahia me pehea te whakamahi i te Spark mo te tukatuka raraunga me te raweke, me pehea te hono pai ki a Databricks ki te hanga, ki te whakangungu me te tuku tauira ako miihini. I tua atu, ka whakaratohia nga tauira waehere me nga whakaritenga pai hei whakanui ake i nga hua mo tenei hononga.

Hei mutunga, ka taea te hono atu a Apache Spark ki nga Databricks na roto i te whakakotahitanga pai e whai hua ana i nga kaha o nga punaha e rua. Ko tenei mahi tahi e whakarato ana i te taiao tātari raraunga kaha me te tauineine, ka taea e nga kaiwhakamahi te whakamahi i nga kaha matatau o Spark me nga ahuatanga mahi tahi o Databricks.

Ma te hono atu ki a Apache Spark ki nga Databricks, ka taea e nga kaiwhakamahi te whakamahi i nga kaha o te tukatuka toha me te tātari raraunga a Spark, tae atu ki nga hua taumata tiketike me nga ahuatanga mahi tahi e whakaratohia ana e Databricks. Ma tenei whakaurunga ka pai ake te wheako tātari raraunga ka taea e nga roopu te mahi tahi me te mahi tahi kia pai ake.

I tua atu, ko te whakaurunga a Apache Spark me nga Databricks e whakarato ana i te papahanga tātaritanga raraunga kapua whakakotahi e ngawari ana nga mahi me te tuku i nga kaiwhakamahi ki te uru atu ki etahi atu waahanga penei i te whakahaere roopu me te whakauru kore ki nga taputapu me nga ratonga tuatoru.

I te poto, ko te hono atu ki a Apache Spark ki Databricks e whakarato ana i nga kaiwhakamahi he otinga tino kaha me te kaha mo te tukatuka raraunga nui me te tātari. Ma tenei whakaurunga, ka taea e nga roopu te uru atu ki nga ahuatanga matatau o Spark me te whakamahi i te pai me te mahi tahi e whakaratohia ana e Databricks. Ko tenei huinga o nga hangarau-a-ahumahi e akiaki ana i te auahatanga me te hiranga i roto i te mara o te pūtaiao raraunga me te tātari raraunga hinonga.