Anonymizing Health Data. Case Studies and Methods to Get You Started
- Autorzy:
- Khaled El Emam, Luk Arbuckle
- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 228
- Dostępne formaty:
-
ePubMobi
Opis ebooka: Anonymizing Health Data. Case Studies and Methods to Get You Started
Updated as of August 2014, this practical book will demonstrate proven methods for anonymizing health data to help your organization share meaningful datasets, without exposing patient identity. Leading experts Khaled El Emam and Luk Arbuckle walk you through a risk-based methodology, using case studies from their efforts to de-identify hundreds of datasets.
Clinical data is valuable for research and other types of analytics, but making it anonymous without compromising data quality is tricky. This book demonstrates techniques for handling different data types, based on the authors’ experiences with a maternal-child registry, inpatient discharge abstracts, health insurance claims, electronic medical record databases, and the World Trade Center disaster registry, among others.
- Understand different methods for working with cross-sectional and longitudinal datasets
- Assess the risk of adversaries who attempt to re-identify patients in anonymized datasets
- Reduce the size and complexity of massive datasets without losing key information or jeopardizing privacy
- Use methods to anonymize unstructured free-form text data
- Minimize the risks inherent in geospatial data, without omitting critical location-based health information
- Look at ways to anonymize coding information in health data
- Learn the challenge of anonymously linking related datasets
Wybrane bestsellery
-
Building and testing machine learning models requires access to large and diverse data. But where can you find usable datasets without running into privacy issues? This practical book introduces techniques for generating synthetic data—fake data generated from real data—so you can per...
Practical Synthetic Data Generation. Balancing Privacy and the Broad Availability of Data Practical Synthetic Data Generation. Balancing Privacy and the Broad Availability of Data
(186.15 zł najniższa cena z 30 dni)186.15 zł
219.00 zł(-15%) -
How can you use data in a way that protects individual privacy but still provides useful and meaningful analytics? With this practical book, data architects and engineers will learn how to establish and integrate secure, repeatable anonymization processes into their data flows and analytics in a ...
Building an Anonymization Pipeline. Creating Safe Data Building an Anonymization Pipeline. Creating Safe Data
(152.15 zł najniższa cena z 30 dni)160.65 zł
189.00 zł(-15%) -
Mastering Data transformation is essential for enhancing their data models and business intelligence. The Definitive Guide to Power Query equips you with the knowledge and skills to master the tool while leveraging its remarkable capabilities.
The Definitive Guide to Power Query (M). Mastering complex data transformation with Power Query The Definitive Guide to Power Query (M). Mastering complex data transformation with Power Query
Gregory Deckler, Rick de Groot, Melissa de Korte, Brian Julius
-
Jeśli w swojej pracy masz lub miewasz do czynienia z danymi, z pewnością orientujesz się, że do tego celu stworzono dotąd całkiem sporo narzędzi. Nic dziwnego – przy tej liczbie danych, z jaką spotykamy się w dzisiejszym cyfrowym świecie, zdolność do ich sprawnego analizowania i wyciągania ...
Grafana. Kurs video. Monitorowanie, analiza i wizualizacja danych w czasie rzeczywistym Grafana. Kurs video. Monitorowanie, analiza i wizualizacja danych w czasie rzeczywistym
(39.90 zł najniższa cena z 30 dni)90.34 zł
139.00 zł(-35%) -
Dzisiejszą gospodarką rządzi informacja. Kto potrafi ją wyłuskać z zalewu danych, ten zyskuje konkurencyjną przewagę. Świadomi tego twórcy oprogramowania komputerowego stworzyli szereg narzędzi służących wyszukiwaniu informacji, ich przetwarzaniu, analizowaniu i prezentowaniu w sposób dostępny dl...
Elasticsearch. Kurs video. Pozyskiwanie i analiza danych Elasticsearch. Kurs video. Pozyskiwanie i analiza danych
(39.90 zł najniższa cena z 30 dni)124.50 zł
249.00 zł(-50%) -
Power Apps to platforma stworzona przez Microsoft, umożliwiająca łatwe projektowanie, tworzenie i dostosowywanie aplikacji bez konieczności posiadania głębokiej wiedzy programistycznej. Z użyciem Power Apps można budować niestandardowe aplikacje, które efektywnie wspierają i automatyzują różne pr...
Power Apps. Kurs video. Tworzenie biznesowych aplikacji no-code Power Apps. Kurs video. Tworzenie biznesowych aplikacji no-code
(39.90 zł najniższa cena z 30 dni)129.35 zł
199.00 zł(-35%) -
Tę książkę docenią wszyscy zainteresowani eksploracją danych i uczeniem maszynowym, którzy chcieliby pewnie poruszać się w świecie nauki o danych. Pokazano tu, w jaki sposób Excel pozwala zobrazować proces ich eksplorowania i jak działają poszczególne techniki w tym zakresie. Przejrzyście wyjaśni...
Eksploracja danych za pomocą Excela. Metody uczenia maszynowego krok po kroku Eksploracja danych za pomocą Excela. Metody uczenia maszynowego krok po kroku
(40.20 zł najniższa cena z 30 dni)43.55 zł
67.00 zł(-35%) -
Oto zwięzłe i równocześnie praktyczne kompendium, w którym znajdziesz 20 praktyk udanego planowania, analizy, specyfikacji, walidacji i zarządzania wymaganiami. Praktyki te są odpowiednie dla projektów zarządzanych zarówno w tradycyjny, jak i zwinny sposób, niezależnie od branży. Sprawią, że zesp...
Specyfikacja wymagań oprogramowania. Kluczowe praktyki analizy biznesowej Specyfikacja wymagań oprogramowania. Kluczowe praktyki analizy biznesowej
(40.20 zł najniższa cena z 30 dni)53.60 zł
67.00 zł(-20%) -
W dzisiejszej praktyce biznesowej duże znaczenie mają dane i ich analiza. W analizie zastosowanie znajduje wiele modeli statystycznych, implementowanych w różnych programach komputerowych. Na przykład Excel ma specjalny dodatek, nazwany po prostu Analiza Danych. Bardzo popularne narzędzie stanowi...
R i pakiet shiny. Kurs video. Interaktywne aplikacje w analizie danych R i pakiet shiny. Kurs video. Interaktywne aplikacje w analizie danych
(39.90 zł najniższa cena z 30 dni)74.50 zł
149.00 zł(-50%) -
Oto drugie, zaktualizowane i uzupełnione wydanie przewodnika po bibliotece Pandas. Dzięki tej przystępnej książce nauczysz się w pełni korzystać z możliwości oferowanych przez bibliotekę, nawet jeśli dopiero zaczynasz przygodę z analizą danych w Pythonie. Naukę rozpoczniesz z użyciem rzeczywisteg...
Jak analizować dane z biblioteką Pandas. Praktyczne wprowadzenie. Wydanie II Jak analizować dane z biblioteką Pandas. Praktyczne wprowadzenie. Wydanie II
(65.40 zł najniższa cena z 30 dni)70.85 zł
109.00 zł(-35%)
Ebooka "Anonymizing Health Data. Case Studies and Methods to Get You Started" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Anonymizing Health Data. Case Studies and Methods to Get You Started" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Anonymizing Health Data. Case Studies and Methods to Get You Started" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-14-493-6303-1, 9781449363031
- Data wydania ebooka:
- 2013-12-11 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 3.5MB
- Rozmiar pliku Mobi:
- 7.7MB
Spis treści ebooka
- Anonymizing Health Data
- Preface
- Audience
- Conventions Used in this Book
- Safari Books Online
- How to Contact Us
- Content Updates
- August 2014
- Acknowledgements
- 1. Introduction
- To Anonymize or Not to Anonymize
- Consent, or Anonymization?
- Penny Pinching
- People Are Private
- To Anonymize or Not to Anonymize
- The Two Pillars of Anonymization
- Masking Standards
- De-Identification Standards
- Lists
- Heuristics
- Risk-based methodology
- Anonymization in the Wild
- Organizational Readiness
- Making It Practical
- Making It Automated
- Use Cases
- Stigmatizing Analytics
- Anonymization in Other Domains
- About This Book
- 2. A Risk-Based De-Identification Methodology
- Basic Principles
- Steps in the De-Identification Methodology
- Step 1: Selecting Direct and Indirect Identifiers
- Step 2: Setting the Threshold
- Step 3: Examining Plausible Attacks
- Step 4: De-Identifying the Data
- Step 5: Documenting the Process
- Measuring Risk Under Plausible Attacks
- T1: Deliberate Attempt at Re-Identification
- T2: Inadvertent Attempt at Re-Identification
- T3: Data Breach
- T4: Public Data
- Measuring Re-Identification Risk
- Probability Metrics
- Information Loss Metrics
- Risk Thresholds
- Choosing Thresholds
- Meeting Thresholds
- Risky Business
- 3. Cross-Sectional Data: Research Registries
- Process Overview
- Secondary Uses and Disclosures
- Getting the Data
- Formulating the Protocol
- Negotiating with the Data Access Committee
- Process Overview
- BORN Ontario
- BORN Data Set
- Risk Assessment
- Threat Modeling
- Results
- Year on Year: Reusing Risk Analyses
- Final Thoughts
- 4. Longitudinal Discharge Abstract Data: State Inpatient Databases
- Longitudinal Data
- Dont Treat It Like Cross-Sectional Data
- Longitudinal Data
- De-Identifying Under Complete Knowledge
- Approximate Complete Knowledge
- Exact Complete Knowledge
- Implementation
- Generalization Under Complete Knowledge
- The State Inpatient Database (SID) of California
- The SID of California and Open Data
- Risk Assessment
- Threat Modeling
- Results
- Final Thoughts
- 5. Dates, Long Tails, and Correlation: Insurance Claims Data
- The Heritage Health Prize
- Date Generalization
- Randomizing Dates Independently of One Another
- Shifting the Sequence, Ignoring the Intervals
- Generalizing Intervals to Maintain Order
- Dates and Intervals and Back Again
- A Different Anchor
- Other Quasi-Identifiers
- Connected Dates
- Long Tails
- The Risk from Long Tails
- Threat Modeling
- Number of Claims to Truncate
- Which Claims to Truncate
- Correlation of Related Items
- Expert Opinions
- Predictive Models
- Implications for De-Identifying Data Sets
- Final Thoughts
- 6. Longitudinal Events Data: A Disaster Registry
- Adversary Power
- Keeping Power in Check
- Power in Practice
- A Sample of Power
- Adversary Power
- The WTC Disaster Registry
- Capturing Events
- The WTC Data Set
- The Power of Events
- Risk Assessment
- Threat Modeling
- Results
- Final Thoughts
- 7. Data Reduction: Research Registry Revisited
- The Subsampling Limbo
- How Low Can We Go?
- Not for All Types of Risk
- BORN to Limbo!
- The Subsampling Limbo
- Many Quasi-Identifiers
- Subsets of Quasi-Identifiers
- Covering Designs
- Covering BORN
- Final Thoughts
- 8. Free-Form Text: Electronic Medical Records
- Not So Regular Expressions
- General Approaches to Text Anonymization
- Ways to Mark the Text as Anonymized
- Evaluation Is Key
- Appropriate Metrics, Strict but Fair
- Standards for Recall, and a Risk-Based Approach
- Standards for Precision
- Anonymization Rules
- Informatics for Integrating Biology and the Bedside (i2b2)
- i2b2 Text Data Set
- Risk Assessment
- Threat Modeling
- A Rule-Based System
- Results
- Final Thoughts
- 9. Geospatial Aggregation: Dissemination Areas and ZIP Codes
- Where the Wild Things Are
- Being Good Neighbors
- Distance Between Neighbors
- Circle of Neighbors
- Round Earth
- Flat Earth
- Clustering Neighbors
- We All Have Boundaries
- Fast Nearest Neighbor
- Too Close to Home
- Levels of Geoproxy Attacks
- Measuring Geoproxy Risk
- Accounting for Geoproxy Risk
- Final Thoughts
- 10. Medical Codes: A Hackathon
- Codes in Practice
- Generalization
- The Digits of Diseases
- The Digits of Procedures
- The (Alpha)Digits of Drugs
- Suppression
- Shuffling
- Final Thoughts
- 11. Masking: Oncology Databases
- Schema Shmema
- Data in Disguise
- Field Suppression
- Randomization
- Pseudonymization
- Frequency of Pseudonyms
- Masking On the Fly
- Final Thoughts
- 12. Secure Linking
- Lets Link Up
- Doing It Securely
- Dont Try This at Home
- The Third-Party Problem
- Basic Layout for Linking Up
- The Nitty-Gritty Protocol for Linking Up
- Bringing Paillier to the Parties
- Matching on the Unknown
- Scaling Up
- Cuckoo Hashing
- How Fast Does a Cuckoo Run?
- Final Thoughts
- 13. De-Identification and Data Quality: A Clinical Data Warehouse
- Useful Data from Useful De-Identification
- Degrees of Loss
- Workload-Aware De-Identification
- Questions to Improve Data Utility
- A Clinical Data Warehouse
- GI Protocol
- Chlamydia Protocol
- Date Shifting
- Final Thoughts
- Index
- Colophon
- Copyright
O'Reilly Media - inne książki
-
Software as a service (SaaS) is on the path to becoming the de facto model for building, delivering, and operating software solutions. Adopting a multi-tenant SaaS model requires builders to take on a broad range of new architecture, implementation, and operational challenges. How data is partiti...(237.15 zł najniższa cena z 30 dni)
245.65 zł
289.00 zł(-15%) -
Great engineers don't necessarily make great leaders—at least, not without a lot of work. Finding your path to becoming a strong leader is often fraught with challenges. It's not easy to figure out how to be strategic, successful, and considerate while also being firm. Whether you're on the...(118.15 zł najniższa cena z 30 dni)
126.65 zł
149.00 zł(-15%) -
Data science happens in code. The ability to write reproducible, robust, scaleable code is key to a data science project's success—and is absolutely essential for those working with production code. This practical book bridges the gap between data science and software engineering,and clearl...(211.65 zł najniższa cena z 30 dni)
220.15 zł
259.00 zł(-15%) -
With the massive adoption of microservices, operators and developers face far more complexity in their applications today. Service meshes can help you manage this problem by providing a unified control plane to secure, manage, and monitor your entire network. This practical guide shows you how th...(194.65 zł najniższa cena z 30 dni)
211.65 zł
249.00 zł(-15%) -
Get practical advice on how to leverage AI development tools for all stages of code creation, including requirements, planning, design, coding, debugging, testing, and documentation. With this book, beginners and experienced developers alike will learn how to use a wide range of tools, from gener...(177.65 zł najniższa cena z 30 dni)
164.25 zł
219.00 zł(-25%) -
Rust's popularity is growing, due in part to features like memory safety, type safety, and thread safety. But these same elements can also make learning Rust a challenge, even for experienced programmers. This practical guide helps you make the transition to writing idiomatic Rust—while als...(177.65 zł najniższa cena z 30 dni)
164.25 zł
219.00 zł(-25%) -
Advance your Power BI skills by adding AI to your repertoire at a practice level. With this practical book, business-oriented software engineers and developers will learn the terminologies, practices, and strategy necessary to successfully incorporate AI into your business intelligence estate. Je...(211.65 zł najniższa cena z 30 dni)
220.15 zł
259.00 zł(-15%) -
Microservices can be a very effective approach for delivering value to your organization and to your customers. If you get them right, microservices help you to move fast by making changes to small parts of your system hundreds of times a day. But if you get them wrong, microservices will just ma...(203.15 zł najniższa cena z 30 dni)
211.65 zł
249.00 zł(-15%) -
JavaScript gives web developers great power to create rich interactive browser experiences, and much of that power is provided by the browser itself. Modern web APIs enable web-based applications to come to life like never before, supporting actions that once required browser plug-ins. Some are s...(186.15 zł najniższa cena z 30 dni)
186.15 zł
219.00 zł(-15%) -
How will software development and operations have to change to meet the sustainability and green needs of the planet? And what does that imply for development organizations? In this eye-opening book, sustainable software advocates Anne Currie, Sarah Hsu, and Sara Bergman provide a unique overview...(160.65 zł najniższa cena z 30 dni)
169.14 zł
199.00 zł(-15%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
Oceny i opinie klientów: Anonymizing Health Data. Case Studies and Methods to Get You Started Khaled El Emam, Luk Arbuckle (0) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.