Data Science on the Google Cloud Platform. 2nd Edition
- Autor:
- Valliappa Lakshmanan
- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 462
- Dostępne formaty:
-
ePubMobi
Opis ebooka: Data Science on the Google Cloud Platform. 2nd Edition
Learn how easy it is to apply sophisticated statistical and machine learning methods to real-world problems when you build using Google Cloud Platform (GCP). This hands-on guide shows data engineers and data scientists how to implement an end-to-end data pipeline with cloud native tools on GCP.
Throughout this updated second edition, you'll work through a sample business decision by employing a variety of data science approaches. Follow along by building a data pipeline in your own project on GCP, and discover how to solve data science problems in a transformative and more collaborative way.
You'll learn how to:
- Employ best practices in building highly scalable data and ML pipelines on Google Cloud
- Automate and schedule data ingest using Cloud Run
- Create and populate a dashboard in Data Studio
- Build a real-time analytics pipeline using Pub/Sub, Dataflow, and BigQuery
- Conduct interactive data exploration with BigQuery
- Create a Bayesian model with Spark on Cloud Dataproc
- Forecast time series and do anomaly detection with BigQuery ML
- Aggregate within time windows with Dataflow
- Train explainable machine learning models with Vertex AI
- Operationalize ML with Vertex AI Pipelines
Wybrane bestsellery
-
Ta książka będzie świetnym uzupełnieniem wiedzy o Flutterze i Darcie, sprawdzi się również jako wsparcie podczas rozwiązywania konkretnych problemów. Znalazło się tu ponad sto receptur, dzięki którym poznasz tajniki pisania efektywnego kodu, korzystania z narzędzi udostępnianych przez framework F...
Flutter i Dart. Receptury. Tworzenie chmurowych aplikacji full stack Flutter i Dart. Receptury. Tworzenie chmurowych aplikacji full stack
(41.40 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%) -
Czy chcesz szybko i skutecznie opanować podstawy Microsoft Azure, zrozumieć jego architekturę i możliwości? W takim razie to książka dla Ciebie! Czy chcesz nauczyć się, jak wdrażać, zarządzać i skalować aplikacje w chmurze Azure, nie tracąc przy tym cennego czasu? W takim razie to książka dla C...
Azure w 1 dzień. Microsoft Azure od podstaw po zaawansowane techniki Azure w 1 dzień. Microsoft Azure od podstaw po zaawansowane techniki
-
Oto zaktualizowane wydanie bestsellerowego przewodnika dla architektów rozwiązań. Dzięki niemu dobrze poznasz wzorce projektowe wbudowane w chmurę, czyli model AWS Well-Architected Framework. Zaznajomisz się z sieciami w chmurze AWS z uwzględnieniem sieci brzegowych i tworzeniem hybrydowych połąc...
AWS dla architektów rozwiązań. Tworzenie, skalowanie i migracja aplikacji do chmury Amazon Web Services. Wydanie II AWS dla architektów rozwiązań. Tworzenie, skalowanie i migracja aplikacji do chmury Amazon Web Services. Wydanie II
Saurabh Shrivastava, Neelanjali Srivastav, Alberto Artasanchez, Imtiaz Sayed
(83.40 zł najniższa cena z 30 dni)97.30 zł
139.00 zł(-30%) -
Szukasz kursu, który pomoże Ci zdobyć wiele praktycznych umiejętności związanych z korzystaniem z narzędzia Terraform? Jesteś we właściwym miejscu. Terraform, określany jako oprogramowanie pozwalające zarządzać infrastrukturą komputerową w modelu „infrastruktura jako kod”, służy w pra...
Terraform w praktyce. Kurs video. Architektura serverless i usługi chmurowe AWS Terraform w praktyce. Kurs video. Architektura serverless i usługi chmurowe AWS
(39.90 zł najniższa cena z 30 dni)67.60 zł
169.00 zł(-60%) -
To trzecie wydanie przewodnika autorstwa twórców Kubernetesa. Zostało starannie zaktualizowane i wzbogacone o tak ważne zagadnienia jak bezpieczeństwo, dostęp do Kubernetesa za pomocą kodu napisanego w różnych językach programowania czy tworzenie aplikacji wieloklastrowych. Dzięki książce poznasz...
Kubernetes. Tworzenie niezawodnych systemów rozproszonych. Wydanie III Kubernetes. Tworzenie niezawodnych systemów rozproszonych. Wydanie III
(41.40 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%) -
To praktyczny przewodnik dla inżynierów, którzy chcą planować i wdrażać usługi Amazon Web Services. Przyda się również osobom planującym zdobycie certyfikatu AWS. Przedstawiono tu zasady pracy zgodne z najlepszymi praktykami Well-Architected Framework firmy Amazon, wprowadzono kluczowe koncepcje,...
Amazon Web Services. Podstawy korzystania z chmury AWS Amazon Web Services. Podstawy korzystania z chmury AWS
(34.90 zł najniższa cena z 30 dni)44.50 zł
89.00 zł(-50%)
Valliappa Lakshmanan - pozostałe książki
-
All cloud architects need to know how to build data platforms that enable businesses to make data-driven decisions and deliver enterprise-wide intelligence in a fast and efficient way. This handbook shows you how to design, build, and modernize cloud native data and machine learning platforms us...(203.15 zł najniższa cena z 30 dni)
211.65 zł
249.00 zł(-15%) -
This practical book shows you how to employ machine learning models to extract information from images. ML engineers and data scientists will learn how to solve a variety of image problems including classification, object detection, autoencoders, image generation, counting, and captioning with pr...(245.65 zł najniższa cena z 30 dni)
245.65 zł
289.00 zł(-15%) -
Rozwiązania typowych problemów dotyczących przygotowania danych, konstruowania modeli i MLOps Wzorce projektowe opisane w tej książce obejmują najlepsze praktyki i rozwiązania powtarzalnych problemów w uczeniu maszynowym. Autorzy, troje inżynierów z firmy Google, skatalogo...
Wzorce projektowe uczenia maszynowego. Rozwiązania typowych problemów dotyczących przygotowania danych, konstruowania modeli i MLOps Wzorce projektowe uczenia maszynowego. Rozwiązania typowych problemów dotyczących przygotowania danych, konstruowania modeli i MLOps
(80.99 zł najniższa cena z 30 dni)80.99 zł
89.99 zł(-10%) -
As you move data to the cloud, you need to consider a comprehensive approach to data governance, along with well-defined and agreed-upon policies to ensure your organization meets compliance requirements. Data governance incorporates the ways people, processes, and technology work together to ens...(211.65 zł najniższa cena z 30 dni)
220.15 zł
259.00 zł(-15%) -
The design patterns in this book capture best practices and solutions to recurring problems in machine learning. The authors, three Google engineers, catalog proven methods to help data scientists tackle common problems throughout the ML process. These design patterns codify the experience of hun...(186.15 zł najniższa cena z 30 dni)
186.15 zł
219.00 zł(-15%) -
Work with petabyte-scale datasets while building a collaborative, agile workplace in the process. This practical book is the canonical reference to Google BigQuery, the query engine that lets you conduct interactive analysis of large datasets. BigQuery enables enterprises to efficiently store, qu...
Google BigQuery: The Definitive Guide. Data Warehousing, Analytics, and Machine Learning at Scale Google BigQuery: The Definitive Guide. Data Warehousing, Analytics, and Machine Learning at Scale
(186.15 zł najniższa cena z 30 dni)186.15 zł
219.00 zł(-15%)
Ebooka "Data Science on the Google Cloud Platform. 2nd Edition" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Data Science on the Google Cloud Platform. 2nd Edition" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Data Science on the Google Cloud Platform. 2nd Edition" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-10-981-1891-4, 9781098118914
- Data wydania ebooka:
- 2022-03-29 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 11.4MB
- Rozmiar pliku Mobi:
- 21.0MB
Spis treści ebooka
- Preface
- Who This Book Is For
- Conventions Used in This Book
- Using Code Examples
- OReilly Online Learning
- How to Contact Us
- Acknowledgments
- 1. Making Better Decisions Based on Data
- Many Similar Decisions
- The Role of Data Scientists
- Scrappy Environment
- Full Stack Cloud Data Scientists
- Collaboration
- Best Practices
- Simple to Complex Solutions
- Cloud Computing
- Serverless
- A Probabilistic Decision
- Probabilistic Approach
- Probability Density Function
- Cumulative Distribution Function
- Choices Made
- Choosing Cloud
- Not a Reference Book
- Getting Started with the Code
- Agile Architecture for Data Science on Google Cloud
- What Is Agile Architecture?
- No-Code, Low-Code
- Use Managed Services
- Summary
- Suggested Resources
- 2. Ingesting Data into the Cloud
- Airline On-Time Performance Data
- Knowability
- Causality
- TrainingServing Skew
- Downloading Data
- Hub-and-Spoke Architecture
- Dataset Fields
- Airline On-Time Performance Data
- Separation of Compute and Storage
- Scaling Up
- Scaling Out with Sharded Data
- Scaling Out with Data-in-Place
- Ingesting Data
- Reverse Engineering a Web Form
- Dataset Download
- Exploration and Cleanup
- Uploading Data to Google Cloud Storage
- Loading Data into Google BigQuery
- Advantages of a Serverless Columnar Database
- Staging on Cloud Storage
- Access Control
- Ingesting CSV Files
- Partitioning
- Scheduling Monthly Downloads
- Ingesting in Python
- Cloud Run
- Securing Cloud Run
- Deploying and Invoking Cloud Run
- Scheduling Cloud Run
- Summary
- Code Break
- Suggested Resources
- 3. Creating Compelling Dashboards
- Explain Your Model with Dashboards
- Why Build a Dashboard First?
- Accuracy, Honesty, and Good Design
- Explain Your Model with Dashboards
- Loading Data into Cloud SQL
- Create a Google Cloud SQL Instance
- Create Table of Data
- Interacting with the Database
- Querying Using BigQuery
- Schema Exploration
- Using Preview
- Using Table Explorer
- Creating BigQuery View
- Building Our First Model
- Contingency Table
- Threshold Optimization
- Building a Dashboard
- Getting Started with Data Studio
- Creating Charts
- Adding End-User Controls
- Showing Proportions with a Pie Chart
- Explaining a Contingency Table
- Modern Business Intelligence
- Digitization
- Natural Language Queries
- Connected Sheets
- Summary
- Suggested Resources
- 4. Streaming Data: Publication and Ingest with Pub/Sub and Dataflow
- Designing the Event Feed
- Transformations Needed
- Architecture
- Getting Airport Information
- Sharing Data
- Sharing a Cloud Storage dataset
- Sharing a BigQuery dataset
- Dataplex and Analytics Hub
- Designing the Event Feed
- Time Correction
- Apache Beam/Cloud Dataflow
- Parsing Airports Data
- Adding Time Zone Information
- Converting Times to UTC
- Correcting Dates
- Creating Events
- Reading and Writing to the Cloud
- Running the Pipeline in the Cloud
- Publishing an Event Stream to Cloud Pub/Sub
- Speed-Up Factor
- Get Records to Publish
- How Many Topics?
- Iterating Through Records
- Building a Batch of Events
- Publishing a Batch of Events
- Real-Time Stream Processing
- Streaming in Dataflow
- Windowing a Pipeline
- Streaming Aggregation
- Using Event Timestamps
- Executing the Stream Processing
- Analyzing Streaming Data in BigQuery
- Real-Time Dashboard
- Summary
- Suggested Resources
- 5. Interactive Data Exploration with Vertex AI Workbench
- Exploratory Data Analysis
- Exploration with SQL
- Reading a Query Explanation
- Exploratory Data Analysis
- Exploratory Data Analysis in Vertex AI Workbench
- Jupyter Notebooks
- Creating a Notebook
- Jupyter Commands
- Installing Packages
- Jupyter Magic for Google Cloud
- Exploring Arrival Delays
- Basic Statistics
- Plotting Distributions
- Quality Control
- Oddball values
- Outlier removal: Big data is different
- Filtering data on occurrence frequency
- Arrival Delay Conditioned on Departure Delay
- Distribution of arrival delays
- Applying a probabilistic decision threshold
- Empirical probability distribution function
- The answer is...
- Evaluating the Model
- Random Shuffling
- Splitting by Date
- Training and Testing
- Summary
- Suggested Resources
- 6. Bayesian Classifier with Apache Spark on Cloud Dataproc
- MapReduce and the Hadoop Ecosystem
- How MapReduce Works
- Apache Hadoop
- MapReduce and the Hadoop Ecosystem
- Google Cloud Dataproc
- Need for Higher-Level Tools
- Jobs, Not Clusters
- Preinstalling Software
- Quantization Using Spark SQL
- JupyterLab on Cloud Dataproc
- Independence Check Using BigQuery
- Spark SQL in JupyterLab
- Histogram Equalization
- Bayesian Classification
- Bayes in Each Bin
- Evaluating the Model
- Dynamically Resizing Clusters
- Comparing to Single Threshold Model
- Orchestration
- Submitting a Spark Job
- Workflow Template
- Cloud Composer
- Autoscaling
- Serverless Spark
- Summary
- Suggested Resources
- 7. Logistic Regression Using Spark ML
- Logistic Regression
- How Logistic Regression Works
- Spark ML Library
- Getting Started with Spark Machine Learning
- Logistic Regression
- Spark Logistic Regression
- Creating a Training Dataset
- Dealing with corner cases
- Creating training examples
- Creating a Training Dataset
- Training the Model
- Predicting Using the Model
- Evaluating a Model
- Feature Engineering
- Experimental Framework
- Choosing a metric
- Creating the held-out dataset
- Experimental Framework
- Feature Selection
- Creating a large cluster
- Increasing quota
- Autoscale up and down
- Removing features
- Feature Transformations
- Scaling
- Clipping
- Feature Creation
- Categorical Variables
- Repeatable, Real Time
- Summary
- Suggested Resources
- 8. Machine Learning with BigQuery ML
- Logistic Regression
- Presplit Data
- Interrogating the Model
- Evaluating the Model
- Scale and Simplicity
- Logistic Regression
- Nonlinear Machine Learning
- XGBoost
- Hyperparameter Tuning
- Vertex AI AutoML Tables
- Time Window Features
- Taxi-Out Time
- Compounding Delays
- Causality
- Time Features
- Departure Hour
- Transform Clause
- Categorical Variable
- Feature Cross
- Summary
- Suggested Resources
- 9. Machine Learning with TensorFlow in Vertex AI
- Toward More Complex Models
- Preparing BigQuery Data for TensorFlow
- Reading Data into TensorFlow
- Toward More Complex Models
- Training and Evaluation in Keras
- Model Function
- Features
- Inputs
- Training the Keras Model
- Saving and Exporting
- Deep Neural Network
- Wide-and-Deep Model in Keras
- Representing Air Traffic Corridors
- Bucketing
- Feature Crossing
- Wide-and-Deep Classifier
- Deploying a Trained TensorFlow Model to Vertex AI
- Concepts
- Uploading Model
- Creating Endpoint
- Deploying Model to Endpoint
- Invoking the Deployed Model
- Summary
- Suggested Resources
- 10. Getting Ready for MLOps with Vertex AI
- Developing and Deploying Using Python
- Writing model.py
- Writing the Training Pipeline
- Predefined Split
- AutoML
- Developing and Deploying Using Python
- Hyperparameter Tuning
- Parameterize Model
- Shorten Training Run
- Metrics During Training
- Hyperparameter Tuning Pipeline
- Best Trial to Completion
- Explaining the Model
- Configuring Explanations Metadata
- Creating and Deploying Model
- Obtaining Explanations
- Summary
- Suggested Resources
- 11. Time-Windowed Features for Real-Time Machine Learning
- Time Averages
- Apache Beam and Cloud Dataflow
- Why Apache Beam?
- Why Dataflow?
- Starting points
- Apache Beam and Cloud Dataflow
- Reading and Writing
- Reading from BigQuery
- Local JSON input
- Filtering
- Time Averages
- Time Windowing
- Assigning a timestamp
- Sliding windows
- Computing moving average
- Removing duplicates
- Machine Learning Training
- Machine Learning Dataset
- Label
- Data split
- Distance bug
- Monitoring and verification
- Machine Learning Dataset
- Training the Model
- Changes from Chapter 10
- AutoML model
- Custom model
- Streaming Predictions
- Reuse Transforms
- Input and Output
- Invoking Model
- Reusing Endpoint
- Shared handle
- Per-worker instance
- Batching Predictions
- Streaming Pipeline
- Writing to BigQuery
- Executing Streaming Pipeline
- Late and Out-of-Order Records
- Uniformly distributed delay
- Exponential distribution
- Normal distribution
- Watermarks and triggers
- Possible Streaming Sinks
- Choosing a sink
- Cloud Bigtable
- Designing tables
- Designing the row key
- Streaming into Cloud Bigtable
- Querying from Cloud Bigtable
- Summary
- Suggested Resources
- 12. The Full Dataset
- Four Years of Data
- Creating Dataset
- Dataset split
- Shuffling data
- Need for continuous training
- More powerful machines
- Creating Dataset
- Training Model
- Evaluation
- RMSE
- Confusion matrix
- Impact of threshold
- Impact of a feature
- Analyzing errors
- Categorical features
- Four Years of Data
- Summary
- Suggested Resources
- Conclusion
- A. Considerations for Sensitive Data Within Machine Learning Datasets
- Handling Sensitive Information
- Sensitive Data in Columns
- Sensitive Data in Natural Language Datasets
- Sensitive Data in Free-Form Unstructured Data
- Sensitive Data in a Combination of Fields
- Sensitive Data in Unstructured Content
- Handling Sensitive Information
- Protecting Sensitive Data
- Removing Sensitive Data
- Masking Sensitive Data
- Coarsening Sensitive Data
- Establishing a Governance Policy
- Index
O'Reilly Media - inne książki
-
Software as a service (SaaS) is on the path to becoming the de facto model for building, delivering, and operating software solutions. Adopting a multi-tenant SaaS model requires builders to take on a broad range of new architecture, implementation, and operational challenges. How data is partiti...(237.15 zł najniższa cena z 30 dni)
245.65 zł
289.00 zł(-15%) -
Great engineers don't necessarily make great leaders—at least, not without a lot of work. Finding your path to becoming a strong leader is often fraught with challenges. It's not easy to figure out how to be strategic, successful, and considerate while also being firm. Whether you're on the...(118.15 zł najniższa cena z 30 dni)
126.65 zł
149.00 zł(-15%) -
Data science happens in code. The ability to write reproducible, robust, scaleable code is key to a data science project's success—and is absolutely essential for those working with production code. This practical book bridges the gap between data science and software engineering,and clearl...(211.65 zł najniższa cena z 30 dni)
220.15 zł
259.00 zł(-15%) -
With the massive adoption of microservices, operators and developers face far more complexity in their applications today. Service meshes can help you manage this problem by providing a unified control plane to secure, manage, and monitor your entire network. This practical guide shows you how th...(194.65 zł najniższa cena z 30 dni)
211.65 zł
249.00 zł(-15%) -
Get practical advice on how to leverage AI development tools for all stages of code creation, including requirements, planning, design, coding, debugging, testing, and documentation. With this book, beginners and experienced developers alike will learn how to use a wide range of tools, from gener...(164.25 zł najniższa cena z 30 dni)
186.15 zł
219.00 zł(-15%) -
Rust's popularity is growing, due in part to features like memory safety, type safety, and thread safety. But these same elements can also make learning Rust a challenge, even for experienced programmers. This practical guide helps you make the transition to writing idiomatic Rust—while als...(164.25 zł najniższa cena z 30 dni)
186.15 zł
219.00 zł(-15%) -
Advance your Power BI skills by adding AI to your repertoire at a practice level. With this practical book, business-oriented software engineers and developers will learn the terminologies, practices, and strategy necessary to successfully incorporate AI into your business intelligence estate. Je...(211.65 zł najniższa cena z 30 dni)
220.15 zł
259.00 zł(-15%) -
Microservices can be a very effective approach for delivering value to your organization and to your customers. If you get them right, microservices help you to move fast by making changes to small parts of your system hundreds of times a day. But if you get them wrong, microservices will just ma...(203.15 zł najniższa cena z 30 dni)
211.65 zł
249.00 zł(-15%) -
JavaScript gives web developers great power to create rich interactive browser experiences, and much of that power is provided by the browser itself. Modern web APIs enable web-based applications to come to life like never before, supporting actions that once required browser plug-ins. Some are s...(186.15 zł najniższa cena z 30 dni)
186.15 zł
219.00 zł(-15%) -
How will software development and operations have to change to meet the sustainability and green needs of the planet? And what does that imply for development organizations? In this eye-opening book, sustainable software advocates Anne Currie, Sarah Hsu, and Sara Bergman provide a unique overview...(169.14 zł najniższa cena z 30 dni)
177.65 zł
209.00 zł(-15%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
Oceny i opinie klientów: Data Science on the Google Cloud Platform. 2nd Edition Valliappa Lakshmanan (0) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.