Zapłać za 30 dni

z PayPo

Prosty zwrot

do 30 dni

Ponad 30 000 opinii

ocena 4.9/5

Darmowa dostawa

już od 500 zł

Wyślemy w poniedziałek

Zaloguj Kontakt

Schowek

Data science od podstaw. Analiza danych w Pythonie. Wydanie II - Joel Grus

Indeks: KSZ-21247 EAN: 9788383221311

Zadaj pytanie

Usuń ze schowka Dodaj do schowka

Podręcznik zawiera zagadnienia związane z podstawami nauki o danych. Przeznaczony jest dla przyszłych programistów. Wyjaśnia niezbędne elementy matematyki i statystyki. Przedstawia także techniki budowy potrzebnych narzędzi i sposoby działania najistotniejszych algorytmów. Zamieszczone w książce przykłady napisano w Pythonie, a pracę na danych ułatwia szereg przydatnych bibliotek Pythona. Drugie wydanie porusza nowe tematy, takie jak uczenie głębokie, statystyka i przetwarzanie języka naturtalnego, a także działania na ogromnych zbiorach danych.

49,90 zł

47,52 zł netto

Zapłać później

SPRAWDŹ ILOŚĆ

Producent: Helion

Opis produktu: Data science od podstaw. Analiza danych w Pythonie. Wydanie II - Joel Grus

Podręcznik zawiera zagadnienia związane z podstawami nauki o danych. Przeznaczony jest dla przyszłych programistów. Wyjaśnia niezbędne elementy matematyki i statystyki. Przedstawia także techniki budowy potrzebnych narzędzi i sposoby działania najistotniejszych algorytmów. Zamieszczone w książce przykłady napisano w Pythonie, a pracę na danych ułatwia szereg przydatnych bibliotek Pythona. Drugie wydanie porusza nowe tematy, takie jak uczenie głębokie, statystyka i przetwarzanie języka naturalnego, a także działania na ogromnych zbiorach danych. Data science od podstaw. Analiza danych w Pythonie zawiera między innymi:

Elementy algebry liniowej, statystyki i rachunku prawdopodobieństwa
Zbieranie, oczyszczanie i eksploracja danych
Algorytmy modeli analizy danych
Podstawy uczenia maszynowego
Systemy rekomendacji i przetwarzanie języka naturalnego
Analiza sieci społecznościowych i algorytm MapReduce

Data science od podstaw. Analiza danych w Pythonie. Wydanie II - Joel Grus.

Data science od podstaw. Analiza danych w Pythonie. Wydanie II.

Informacje o autorze

Joel Grus - inżynier oprogramowania, analityk danych i autor książek. Obecnie zajmuje się pracą badawczą w Allen Institute for Artificial Intelligence w Seattle. Pracował w firmie Google i kilku startupach.

Informacje o książce

Tytuł oryginalny: Data Science from Scratch: First Principles with Python, 2nd Edition
Autor: Joel Grus
Tłumaczenie: Wojciech Bombik, Konrad Matuk
ISBN: 978-83-8322-131-1
Rok wydania: 2020
Format: 168 x 237 mm
Oprawa: miękka
Ilość stron: 352
Wydawnictwo: Helion S.A.

Spis treści

Przedmowa do drugiego wydania 11

Przedmowa do pierwszego wydania 14

1. Wprowadzenie 17

Znaczenie danych 17
Czym jest analiza danych? 17
Hipotetyczna motywacja 18

Określanie najważniejszych węzłów 19
Analitycy, których możesz znać 21
Wynagrodzenie i doświadczenie 23
Płatne konta 25
Tematy interesujące użytkowników 26
Co dalej? 27

2. Błyskawiczny kurs Pythona 29

Zasady tworzenia kodu Pythona 29
Skąd wziąć interpreter Pythona? 30
Środowiska wirtualne 30
Formatowanie za pomocą białych znaków 31
Moduły 32
Polskie znaki diakrytyczne 33
Funkcje 33
Łańcuchy 34
Wyjątki 35
Listy 35
Krotki 36
Słowniki 37

defaultdict 38

Counter 39
Zbiory 39
Przepływ sterowania 40
Wartości logiczne 41
Sortowanie 42
Składanie list 42
Testy automatyczne i instrukcja assert 43
Programowanie obiektowe 43
Obiekty iterowalne i generatory 45
Losowość 46
Wyrażenia regularne 47
Narzędzia funkcyjne 48
Funkcja zip i rozpakowywanie argumentów 48
Argumenty nazwane i nienazwane 49
Adnotacje typów 50

Jak pisać adnotacje typów 52

Witaj w firmie DataSciencester! 53
Dalsza eksploracja 53

3. Wizualizacja danych 55

Pakiet matplotlib 55
Wykres słupkowy 57
Wykresy liniowe 60
Wykresy punktowe 60
Dalsza eksploracja 63

4. Algebra liniowa 65

Wektory 65
Macierze 69
Dalsza eksploracja 71

5. Statystyka 73

Opis pojedynczego zbioru danych 73

Tendencje centralne 74
Dyspersja 76

Korelacja 78
Paradoks Simpsona 80
Inne pułapki związane z korelacją 81
Korelacja i przyczynowość 81
Dalsza eksploracja 82

6. Prawdopodobieństwo 83

Zależność i niezależność 83
Prawdopodobieństwo warunkowe 84
Twierdzenie Bayesa 85
Zmienne losowe 87
Ciągły rozkład prawdopodobieństwa 87
Rozkład normalny 89
Centralne twierdzenie graniczne 91
Dalsza eksploracja 93

7. Hipotezy i wnioski 95

Sprawdzanie hipotez 95
Przykład: rzut monetą 95
Wartości p 98
Przedziały ufności 99
Hakowanie wartości p 100
Przykład: przeprowadzanie testu A-B 101
Wnioskowanie bayesowskie 102
Dalsza eksploracja 105

8. Metoda gradientu prostego 107

Podstawy metody gradientu prostego 107
Szacowanie gradientu 108
Korzystanie z gradientu 111
Dobór właściwego rozmiaru kroku 111
Używanie metody gradientu do dopasowywania modeli 112
Metody gradientu prostego: stochastyczna i minibatch 113
Dalsza eksploracja 114

9. Uzyskiwanie danych 117

Strumienie stdin i stdout 117
Wczytywanie plików 119

Podstawowe zagadnienia dotyczące plików tekstowych 119
Pliki zawierające dane rozdzielone separatorem 120

Pobieranie danych ze stron internetowych 122

HTML i parsowanie 122
Przykład: wypowiedzi kongresmenów 124

Korzystanie z interfejsów programistycznych 126

Format JSON (i XML) 126
Korzystanie z interfejsu programistycznego bez uwierzytelniania 127
Poszukiwanie interfejsów programistycznych 128

Przykład: korzystanie z interfejsów programistycznych serwisu Twitter 128

Uzyskiwanie danych uwierzytelniających 129

Dalsza eksploracja 132

10. Praca z danymi 133

Eksploracja danych 133

Eksploracja danych jednowymiarowych 133
Dwa wymiary 135
Wiele wymiarów 136

Wykorzystanie klasy NamedTuple 137
Dekorator dataclass 139
Oczyszczanie i wstępne przetwarzanie danych 140
Przetwarzanie danych 141
Przeskalowanie 144
Dygresja: tqdm 145
Redukcja liczby wymiarów 146
Dalsza eksploracja 151

11. Uczenie maszynowe 153

Modelowanie 153
Czym jest uczenie maszynowe? 154
Nadmierne i zbyt małe dopasowanie 154
Poprawność 157
Kompromis pomiędzy wartością progową a wariancją 159
Ekstrakcja i selekcja cech 161
Dalsza eksploracja 162

12. Algorytm k najbliższych sąsiadów 163

Model 163
Przykład: dane dotyczące irysów 165
Przekleństwo wymiarowości 168
Dalsza eksploracja 171

13. Naiwny klasyfikator bayesowski 173

Bardzo prosty filtr antyspamowy 173
Bardziej zaawansowany filtr antyspamowy 174
Implementacja 175
Testowanie modelu 177
Używanie modelu 178
Dalsza eksploracja 180

14. Prosta regresja liniowa 181

Model 181
Korzystanie z algorytmu spadku gradientowego 184
Szacowanie maksymalnego prawdopodobieństwa 185
Dalsza eksploracja 185

15. Regresja wieloraka 187

Model 187
Dalsze założenia dotyczące modelu najmniejszych kwadratów 188
Dopasowywanie modelu 189
Interpretacja modelu 190
Poprawność dopasowania 191
Dygresja: ładowanie wstępne 192
Błędy standardowe współczynników regresji 193
Regularyzacja 194
Dalsza eksploracja 196

16. Regresja logistyczna 197

Problem 197
Funkcja logistyczna 199
Stosowanie modelu 201
Poprawność dopasowania 202
Maszyny wektorów nośnych 203
Dalsza eksploracja 206

17. Drzewa decyzyjne 207

Czym jest drzewo decyzyjne? 207
Entropia 209
Entropia podziału 211
Tworzenie drzewa decyzyjnego 211
Łączenie wszystkiego w całość 214
Lasy losowe 216
Dalsza eksploracja 217

18. Sztuczne sieci neuronowe 219

Perceptrony 219
Jednokierunkowe sieci neuronowe 221
Propagacja wsteczna 224
Przykład: Fizz Buzz 226
Dalsza eksploracja 228

19. Uczenie głębokie 229

Tensor 229
Abstrakcja Layer 231
Warstwa Linear 233
Sieci neuronowe jako sekwencje warstw 235
Abstrakcja Loss i optymalizacja 235
Przykład: kolejne podejście do bramki XOR 237
Inne funkcje aktywacji 238
Przykład: kolejne podejście do gry Fizz Buzz 239
Funkcja softmax i entropia krzyżowa 240
Dropout 242
Przykład: MNIST 243
Zapisywanie i wczytywanie modeli 246
Dalsza eksploracja 247

20. Grupowanie 249

Idea 249
Model 250
Przykład: spotkania 252
Wybór wartości parametru k 253
Przykład: grupowanie kolorów 255
Grupowanie hierarchiczne z podejściem aglomeracyjnym 257
Dalsza eksploracja 261

21. Przetwarzanie języka naturalnego 263

Chmury wyrazowe 263
Modele n-gram 264
Gramatyka 267
Na marginesie: próbkowanie Gibbsa 269
Modelowanie tematu 271
Wektory słów 275
Rekurencyjne sieci neuronowe 283
Przykład: używanie rekurencyjnej sieci neuronowej na poziomie pojedynczych znaków 285
Dalsza eksploracja 288

22. Analiza sieci społecznościowych 289

Pośrednictwo 289
Centralność wektorów własnych 294

Mnożenie macierzy 294
Centralność 295

Grafy skierowane i metoda PageRank 297
Dalsza eksploracja 299

23. Systemy rekomendujące 301

Ręczne rozwiązywanie problemu 301
Rekomendowanie tego, co jest popularne 302
Filtrowanie kolaboratywne oparte na użytkownikach 303
Filtrowanie kolaboratywne oparte na zainteresowaniach 305
Faktoryzacja macierzy 307
Dalsza eksploracja 311

24. Bazy danych i SQL 313

Polecenia CREATE TABLE i INSERT 313
Polecenie UPDATE 316
Polecenie DELETE 316
Polecenie SELECT 317
Polecenie GROUP BY 319
Polecenie ORDER BY 321
Polecenie JOIN 322
Zapytania składowe 324
Indeksy 324
Optymalizacja zapytań 325
Bazy danych NoSQL 326
Dalsza eksploracja 326

25. Algorytm MapReduce 327

Przykład: liczenie słów 327
Dlaczego warto korzystać z algorytmu MapReduce? 329
Algorytm MapReduce w ujęciu bardziej ogólnym 330
Przykład: analiza treści statusów 331
Przykład: mnożenie macierzy 332
Dodatkowe informacje: zespalanie 334
Dalsza eksploracja 334

26. Etyka przetwarzania danych 335

Czym jest etyka danych? 335
Ale tak naprawdę to czym jest etyka danych? 336
Czy powinienem przejmować się etyką danych? 336
Tworzenie złych produktów wykorzystujących dane 337
Kompromis między dokładnością a uczciwością 337
Współpraca 339
Interpretowalność 339
Rekomendacje 340
Tendencyjne dane 340
Ochrona danych 341
Podsumowanie 342
Dalsza eksploracja 342

27. Praktyka czyni mistrza 343

IPython 343
Matematyka 343
Korzystanie z gotowych rozwiązań 344

NumPy 344
pandas 344
scikit-learn 344
Wizualizacja 345
R 345
Uczenie głębokie 346

Szukanie danych 346
Zabierz się za analizę 346

Hacker News 347
Wozy straży pożarnej 347
Koszulki 347
Tweety na kuli ziemskiej 348
A Ty? 348

Przydatne linki

Przykładowy rozdział

Książka - Autor	Joel Grus
Książka - ISBN	978-83-283-6154-6
Książka - Oprawa	miękka
Książka - Wydawnictwo	Helion S.A.
Tematyka	Python
Szerokość opakowania	17 cm
Wysokość opakowania	24 cm
Głębokość opakowania	2 cm
Masa opakowania	0.567 kg

21247.pdf (941.04k)

Wyślij pytanie

Jako pierwszy zadaj pytanie dotyczące tego produktu!