მონაცემთა ინჟინერია

  • 5.0 შეფასება

  • 33 ლექცია

  • 66 საათი

  • 17 კვირა

მონაცემთა ინჟინერია არის ფუნდამენტი, რომელზეც თანამედროვე Data ეკოსისტემა დგას. თავისი არსით, მონაცემთა ინჟინერიის მიზანია ისეთი სისტემებისა და ინფრასტრუქტურის დიზაინის შემუშავება და დაპროექტება, რომელიც ავტომატურ რეჟიმში შეაგროვებს, შეინახავს და გააანალიზებს მათ. უპირველეს ყოვლისა, მონაცემთა ინჟინერიის მიზანია, შეიმუშავოს ისეთი მეთოდოლოგიები და ხელსაწყოები, რომელიც პროცესების მაქსიმალურ სრულყოფილებას, ინფორმაციის მდგრადობასა და სანდოობას უზრუნველყოფს. ფუნდამენტურ ცნებებსა და კონცეფციებთან ერთად, კურსის ფარგლებში, სტუდენტები შეისწავლიან მონაცემთა ინჟინერიისთვის ისეთი საკვანძო ტექნოლოგიებისა და ხელსაწყოების გამოყენებას, როგორებიცაა Apache Airflow, Apache Kafka, Apache NiFi, Apache Avro, Apache Parquet, Apache Arrow, მონაცემთა დროებითი და მდგრადი სანახი სისტემები (SQL, NoSQL, PostgreSQL, Redis, ClickHouse), მონაცემებისთვის ვებ-სერვისების დაპროექტება (FastAPI) და Python-ის სხვადასხვა ბიბლიოთეკა. გაიაზრებენ, თუ როგორ ურთიერთქმედებენ ერთმანეთში სხვადასხვა ტექნოლოგია/ხელსაწყო და როგორ გვეხმარება თეორიული კონცეფტები პრაქტიკის სრულყოფაში.

კურსის დასრულების შემდეგ შეგეძლება

დამატებითი უნარები: Python, FastAPI, Apache Airflow, Apache Kafka, Apache NiFi, Apache Arrow, Apache Parquet, Apache Avro, PostgreSQL, Redis, MongoDB, ClickHouse, SQL

  • მონაცემებისა და მათი მნიშვნელობის ფუნდამენტური კონცეფციების გააზრება;

  • Python-ის გამოყენება მონაცემთა ტრანსფორმაციისა და მანიპულაციისთვის;

  • Python-ის მონაცემთა ინჟინერიისა და მონაცემთა ბაზების ბიბლიოთეკების პრაქტიკული გამოყენება;

  • მაღალი წარმადობისა და მდგრადობის პროექტების არქიტექტურული დიზაინის დაპროექტება;

  • მაღალი წარმადობის ვებ-სერვისების გამართვა (FastAPI) და დაპროექტება;

  • მონაცემთა მდგრადობისა და ხარისხის უზრუნველყოფა;

  • ETL და ELT პროცესების დიფერენციაცია და იმპლემენტაცია სხვადასხვა Data პროექტში;

  • მონაცემთა ტრანსფორმაციის პროცესების გამართვა, ორკესტრაცია, დაპროექტება და ანალიზი;

  • მონაცემთა დროებით და მდგრად სანახ სისტემებთან მუშაობა (Redis and postgres). როგორც “columnar” ასევე “row-based” მონაცემთა ბაზები (PostgreSQL, ClickHouse, Redis, MongoDB და ა.შ);

  • Workflow ორკესტრაციისა და დაპროექტების სისტემა, Apache Airflow-ს პრაქტიკული გამოყენება;

  • DAG-ებისა და Scheduler-ების ცნებების გააზრება;

  • Data Workflow სისტემების ანალიზი და დაპროექტება;

  • Apache Kafka-ს ფუნდამენტური კონცეფციების გააზრება;

  • ‘სრულყოფილი’ Kafka-ს კლასტერის გამართვა/გამოყენება;

  • მონაცემთა გადაცემის/ტრანსმისიისა და ორკესტრაციის სისტემა, Apache NiFi-ს პრაქტიკული გამოყენება/გამართვა;

  • სხვადასხვა კომპრესიის, სერიალიზაციისა და სანახი სისტემების პრაქტიკული გამოყენება, როგორებიცაა Apache Arrow/Parquet/Avro;

  • პრაქტიკული მუშაობის უნარი Data Stream-ებსა და Message Broker-ებთან;

  • მონაცემთა შორის დამოკიდებულებებისა და კავშირების ანალიზი/დაპროექტება;

  • მონაცემთა სხვადასხვა შენახვის კონცეფციების პრინციპების გააზრება და მათთან მუშაობა (Data Warehousing, Data Marting).

19 ნოემბერი 2800₾

სამ-ხუთ | 20:00-22:00

7 ოქტომბერი 2800₾

სამ 19:00-21:00 | შაბ 12:00-14:00

გაზაფხული 2800₾

სამ 19:00-21:00 | შაბ 12:00-14:00

გადაანაწილე გადასახადი
TBC განვადება
BOG განვადება

ვისთვის არის კურსი

მონაცემთა ანალიტიკოსებისთვის

ვინც ფლობს Python-ს და აქვს კარიერული განვითარების სურვილი.

დეველოპერებისთვის

ვინც უკვე იცის Python და აქვს ანალიტიკური, დეტალებზე ორიენტირებული აზროვნება.

პროგრამა მოიცავს

კურსდამთავრებულთა კლუბი

ფინალური გამოცდის წარმატებით ჩაბარების შემთხვევაში, კურსდამთავრებული ავტომატურად ირიცხება Alumni Club-ში, შემდეგ კი იღებს წვდომას ექსკლუზიურ ივენთებზე, კონტენტსა და შეთავაზებებზე ჩვენი პარტნიორი კომპანიებისგან.

პრაქტიკული პროექტები

პრაქტიკაზე დაფუძნებულ სწავლება, რაშიც იგულისხმება დავალებები / სავარჯიშოები და ინდივიდუალური ფინალური პროექტი.

ორენოვანი სერტიფიკატი

კურსის წარმატებით დასრულების შემდეგ სტუდენტი მიიღებს ორენოვან სერტიფიკატს.

კურსდამთავრებულები

5.0 Rate

სილაბუსი

რა არის მონაცემთა ინჟინერია;
მონაცემთა ინჟინერის პასუხიმსგებლობები;
მონაცემებზე ორიენტირებული აზროვნება;
პერფექციონიზმი
რა არის პარალელიზმი;
როგორ განვსაზღვროთ “დაპარალელებადი” პროცესები;
Multiprocessing;
ნაკადები vs პროცესები;
Multithreading;
Lab სესია / სალექციო და პრაქტიკული დავალება
Methods to work with CSV Dataframes 50x faster;
WORM ფაილები (Apache Avro, Apache Arrow, Apache Parquet, etc)
Delimited ფაილები (CSV);
ACID და I/O;
Lab სესია / სალექციო და პრაქტიკული დავალება
ინფორმაციის მდგრადობა;
ფაილებთან მუშაობის პრინციპები;
ფაილების დაყოფის პრინციპები (Partitioning);
ალგორითმები ფაილებთან მუშაობისთვის;
პროექტი - ფაილური სისტემები
API-დან მონაცემების მიღება/დამუშავება (requests);
API-ის დაპროექტება და შემუშავება;
Design Patterns;
Middlewares და პარალელიზმი FastAPI-ში;
Lab სესია / სალექციო და პრაქტიკული დავალება

აარჩიე შენთვის სასურველი დრო

ლექტორები

გუჯა ლომსაძე

Data Engineering

გუჯა ლომსაძე

Data Engineering

გუჯას აქვს 7+ წლიანი გამოცდილება მონაცემთა ინჟინერიისა და ანალიტიკის სფეროში ლიდერულ პოზიციებზე. ამჟამად ის ხელმძღვანელობს მონაცემთა ინჟინერიის გუნდს კომპანია Crocobet-ში და ამასთან, იკავებს Analytics Engineer-ის პოზიციას გერმანულ კომპანია Carnival Maritime-ში, რომელიც უზრუნველყოფს მსოფლიოს უმსხვილესი საკრუიზო კომპანიის - Carnival Corporation-ის ფლოტის მონაცემთა და ტექნიკურ მხარდაჭერას. აღნიშნულმა კომპანიამ გუჯა ლომსაძეს მიანიჭა Data Champion-ის სტატუსი. გუჯა სხვადასხვა დროს მუშაობდა EPAM Global-ში Senior Data Engineer-ის პოზიციაზე და ასევე იყო მონაცემთა ინჟინერიის გუნდის ლიდი მსოფლიოს ერთ-ერთ წამყვან ფარმაცევტულ კომპანია Merck-ში. გუჯას მოპოვებული აქვს მაგისტრის ხარისხი მონაცემთა ინჟინერიაში, გერმანიში - Constructor University-ში.  სწავლის პერიოდში , ამავე უნივერსიტეტში, თავადაც კითხულობდა ლექციებს თემაზე: "Data Management". იგი არის საერთაშორისოდ სერტიფიცირებული მონაცემთა ინჟინერი შემდეგი მიმართულებებით: AWS Certified Data Analyst, AWS Certified Cloud Data Engineer, Google Cloud Platform - Professional Data Engineer.

Linkedin

ხშირად დასმული კითხვები კურსის შესახებ

A: მონაცემთა ინჟინერია სულ უფრო მნიშვნელოვანი ხდება თანამედროვე ციფრულ სამყაროში. ის ხიდს დებს დაუმუშავებელ მონაცემებსა და პრაქტიკულ ინსაითებს შორის, რაც ბიზნესებს საშუალებას აძლევს მიიღონ ინფორმირებული გადაწყვეტილებები. მონაცემთა ინჟინრები ქმნიან და მართავენ ინფრასტრუქტურას, რომელიც ამუშავებს უზარმაზარი მოცულობის მონაცემებს, ხდის მათ ხელმისაწვდომს და სასარგებლოს ანალიზისთვის. ეს სფერო გთავაზობთ კარიერული განვითარების შესანიშნავ პერსპექტივებს, კონკურენტულ ანაზღაურებას და თანამედროვე ტექნოლოგიებთან მუშაობის შესაძლებლობას, რთული პრაქტიკული პრობლემების გადაჭრის პროცესში.
A: კურსზე დაშვებისთვის აუცილებელია Python-ის საბაზისო ცოდნა, ანალიტიკური და დეტალებზე ორიენტირებული აზროვნება, ასევე ინგლისური ენის B2 დონეზე ფლობა. მნიშვნელოვანია მონაცემებთან მუშაობის ინტერესი და მოტივაცია. აქვე, აუცილებელია, სტუდენტმა კურსის დაწყებამდე უზრუნველყოს წვდომა PyCharm PRO-სა და Datagrip-ზე.

Your search Digital Designer did not match any documents

ვერ მიიღე შენთვის საინტერესო ინფორმაცია?

ჩაეწერე უფასო კონსულტაციაზე

შესაძლოა გაინტერესებდეს

რელევანტური რესურსები

იხილე სრულად