Edureka
Spezialisierung PySpark for Data Science

Diese spezialisierung ist nicht verfügbar in Deutsch (Deutschland)

Wir übersetzen es in weitere Sprachen.
Edureka

Spezialisierung PySpark for Data Science

Unlock the potential of PySpark for data science, mastering data processing and analytics , and machine learning to drive insightful decision-making.

Edureka

Dozent: Edureka

Bei Coursera Plus enthalten

Befassen Sie sich eingehend mit einem Thema
Stufe Mittel

Empfohlene Erfahrung

4 months to complete
at 5 hours a week
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Befassen Sie sich eingehend mit einem Thema
Stufe Mittel

Empfohlene Erfahrung

4 months to complete
at 5 hours a week
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

  • Master the fundamentals of Big Data and PySpark to process data using RDDs and DataFrames.

  • Optimize data science workflows by leveraging advanced PySpark DataFrame and SQL operations.

  • Build machine learning models with PySpark MLlib, applying regression and clustering techniques.

  • Implement data streaming with structured streaming and explore NLP for text processing in big data.

Kompetenzen, die Sie erwerben

  • Kategorie: Supervised Learning
  • Kategorie: Pandas (Python Package)
  • Kategorie: Data Processing
  • Kategorie: Data Manipulation
  • Kategorie: Apache Hadoop
  • Kategorie: Data Pipelines
  • Kategorie: Machine Learning Algorithms
  • Kategorie: Machine Learning
  • Kategorie: Apache Spark
  • Kategorie: Distributed Computing
  • Kategorie: Data Transformation
  • Kategorie: PySpark

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihre Fachkenntnisse.

  • Erlernen Sie gefragte Kompetenzen von Universitäten und Branchenexperten.
  • Erlernen Sie ein Thema oder ein Tool mit echten Projekten.
  • Entwickeln Sie ein fundiertes Verständnisse der Kernkonzepte.
  • Erwerben Sie ein Karrierezertifikat von Edureka.

Spezialisierung - 3 Kursreihen

Was Sie lernen werden

  • Explore the fundamental concepts of Big Data and the components of the Hadoop ecosystem.

  • Explain the architecture and key principles of Apache Spark and its role in big data processing.

  • Utilize RDD transformations and actions to effectively process large-scale datasets with PySpark.

  • Execute advanced DataFrame operations, including data manipulation and aggregation techniques.

Kompetenzen, die Sie erwerben

Kategorie: Apache Hadoop
Kategorie: Pandas (Python Package)
Kategorie: Data Manipulation
Kategorie: Apache Spark
Kategorie: Data Processing
Kategorie: PySpark
Kategorie: Data Transformation
Kategorie: Big Data
Kategorie: SQL

Was Sie lernen werden

  • Implement machine learning models using PySpark MLlib.

  • Implement linear and logistic regression models for predictive analysis.

  • Apply clustering methods to group unlabeled data using algorithms like K-means.

  • Explore real-world applications of PySpark MLlib through practical examples.

Kompetenzen, die Sie erwerben

Kategorie: Supervised Learning
Kategorie: Data Processing
Kategorie: Apache Spark
Kategorie: Regression Analysis
Kategorie: Feature Engineering
Kategorie: PySpark
Kategorie: Machine Learning Algorithms
Kategorie: Big Data
Kategorie: Machine Learning
Kategorie: Distributed Computing
Kategorie: Scalability
Kategorie: Unsupervised Learning

Was Sie lernen werden

  • Analyze streaming data to extract insights and trends in real-time applications.

  • Analyze real-time data streams and apply Spark Streaming techniques for efficient processing.

  • Develop robust streaming applications using Spark's Structured Streaming for fault-tolerant processing.

  • Implement NLP techniques to process and analyze textual data efficiently.

Kompetenzen, die Sie erwerben

Kategorie: Deep Learning
Kategorie: Performance Tuning
Kategorie: Data Pipelines
Kategorie: Natural Language Processing
Kategorie: Real Time Data
Kategorie: Apache Spark
Kategorie: Data Processing
Kategorie: PySpark
Kategorie: Text Mining
Kategorie: Data Visualization
Kategorie: Scalability
Kategorie: Distributed Computing

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Dozent

Edureka
Edureka
66 Kurse78.284 Lernende

von

Edureka

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.
Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“
Jennifer J.
Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“
Larry W.
Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“
Chaitanya A.
„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“
Coursera Plus

Neue Karrieremöglichkeiten mit Coursera Plus

Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten

Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.

Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online

Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.

Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.

Häufig gestellte Fragen