Data1984 – Telegram
Data1984
787 subscribers
44 photos
1 video
17 files
762 links
This channel is mostly about data related stuff, some of the main topics are #DataEngineering #SQL #Python #cloud .

Contact: @gorros
Download Telegram
Probably the best book book about Linux command line, I've read it with great pleasure. Ebook is available for free download.
Հավանաբար, լավագույն գիրքը Linux հրամանների մասին, ես այն մեծ հաճույքով եմ կարդացել: Ebook- ը հասանելի է անվճար ներբեռնելու համար:
https://itbook.store/books/9781593273897
I came across of an interesting data quality measurement library from AWS for large datasets.
Բավականին հետաքրքիր գրադարան եմ գտել #AWSից մեծ ծավալի տվյալների որակի չափման համար։
https://github.com/awslabs/deequ
Here is a vocabulary for data engineers, it is a good one but not complete of course :)
Ահա #DataEngineer ների համար բառարան, լավն է,բայց իհարկե ոչ ամբողջական։
https://towardsdatascience.com/complete-data-engineers-vocabulary-87967e374fad
Here another relevant and interesting post from author of spark-daria library. I always learn something from his posts.
Ահա ևս մի արդիական և հետաքրքիր գրառում spark-daria գրադարանի հեղինակի կողմից։ Ես միշտ մի նոր բան եմ սովորում նրա գրառումներից։
https://mungingdata.com/pyspark/poetry-dependency-management-wheel/
@dataeng shared yet another interesting resource, this time about data engineering blog. I find particularly useful the recent post from that blog about getting data engineering job. The author also has YouTube channel.
@dataeng ալիքը հերթական անգամ շատ օգտակար ռեսուրս է գտել, այս անգամ #DataEngineering մասին բլոգ է, որից մասնավորապես հետաքրքիր է վերջին գրառումը. Հեղինակը ունի նաև YouTube ալիք.
If you have to write JavaScript but you don't know JS and you are familiar with #Scala then this is for you 😉
---
Եթե դուք պետք է JavaScript ով գրեք բայց չգիտեք այն և ծանոթ եք #Scala հետ ապա սա ձեզ համար է 😉
https://www.scala-js.org/
Well this is really cool new feature for Redshift users.
---
Այ սա իսկապես հիանալի նոր հատկություն է #Redshift ից օգտվողների համար:
https://aws.amazon.com/about-aws/whats-new/2020/06/amazon-redshift-now-supports-writing-to-external-tables-in-amazon-s3/
This article about #Kafka and #Pulsar came across couple of times. Overall it is detailed comparison, even though there is a feeling that author is really inclined towards #Kafka
-------
#Kafka և #Pulsar մասին այս հոդվածը հանդիպել է մի քանի անգամ: Ընդհանուր առմամբ, դա մանրամասն համեմատություն է, չնայած կա այնպիսի տպավորություն, որ հեղինակը իսկապես հակված է դեպի #Kafka
https://www-kai--waehner-de.cdn.ampproject.org/c/s/www.kai-waehner.de/blog/2020/06/09/apache-kafka-versus-apache-pulsar-event-streaming-comparison-features-myths-explored/amp/
Interesting review of modern tools and approaches to level up your #BI

Ձեր #BI մակարդակը բարձրացնելու ժամանակակից գործիքների և մոտեցումների հետաքրքիր դիտարկում
https://news.1rj.ru/str/dataeng/157
Spark 3.0 is here !

#Spark 3.0 տարբերակը արդեն հասանելի է։
https://spark.apache.org/releases/spark-release-3-0-0.html
​​I don't know if you know, but I am a big #remotework fan :) and even now I am working remotely. Here is a great list for remote work.
---
Չգիտեմ գիտե՞ք, բայց ես հեռակա աշխատանքի կողմնակից եմ :) և նույնիսկ հիմա ես աշխատում եմ հեռակա: Ահա ընդարձակ ցուցակ հեռակա աշխատանքի կազմակերպման գործիքների մասին։

https://medium.com/@ezelby/remote-work-market-map-58591966b0c2
Recently I posted about Spark 3.0 updates. Here is a detailed article from creator for Spark about most important updates.

Վերջերս գրել էի #Spark 3.0 մասին։ Ահա նրա հեղինակի կողմից հոդվածը առավել կարևոր թարմացումների մասին։

https://databricks.com/blog/2020/06/18/introducing-apache-spark-3-0-now-available-in-databricks-runtime-7-0.html