Làm Quen với Pandas và DataFrame | Tự Học Data Science #1

Описание к видео Làm Quen với Pandas và DataFrame | Tự Học Data Science #1

Hello Diu Túp, hôm nay chúng mình xin giới thiệu đến các bạn Series "Tự Học Data Science Cho Người Mới Bắt Đầu". Và chủ đề của Video hôm này là "Làm Quen vs Pandas và DataFrame" 🤩 !

Link Download Dataset trong Video: https://github.com/CodexploreRepo/dat...

Data Science (hay còn gọi là Khoa học dữ liệu) trở thành một trong những ngành có nhu cầu nhân lực cao nhất ở thế kỷ 21. Thuật ngữ “Data Science” cũng là thuật ngữ được nhiều người nhắc đến hằng ngày. Data Science được định nghĩa là tất cả những gì về thu thập, khai thác và phân tích dữ liệu để tìm ra insight giá trị. Sau đó trực quan hóa các Insight cho các bên liên quan, để chuyển hóa Insight thành hành động. Đây là lĩnh vực đa ngành sử dụng các phương pháp và quy trình khoa học để rút ra insight từ dữ liệu.

Pandas là là thư viện mã nguồn mở với hiệu năng cao cho phân tích dữ liệu trong Python được phát triển bởi Wes McKinney trong năm 2008. Chỉ với hơn 1 năm phát triển nó đã trở thành một thư viện chuẩn cho việc phân tích dữ liệu khi dùng Python. Pandas là một thư viện mã nguồn mở được xây dựng dựa trên NumPy, sử dụng thao tác và phân tích dữ liệu, được thiết kế để cho phép bạn làm việc với dữ liệu được gắn nhãn hoặc quan hệ theo cách trực quan hơn

- Có thể xử lý tập dữ liệu khác nhau về định dạng: chuỗi thời gian, bảng không đồng nhất, ma trận dữ liệu
- Khả năng import dữ liệu từ nhiều nguồn khác nhau như CSV, DB/SQL
- Có thể xử lý vô số phép toán cho tập dữ liệu: subsetting, slicing, filtering, merging, groupBy, re-ordering, and re-shaping,..
- Xử lý dữ liệu mất mát theo ý người dùng mong muốn: bỏ qua hoặc chuyển sang 0
- Xử lý, phân tích dữ liệu tốt như mô hình hoá và thống kê
- Tích hợp tốt với các thư viện khác của python
- Cung cấp hiệu suất tốt

[0:00] Giới thiệu về Data Science
[1:30] Giới thiệu về CodeXplore Github Repo
Link: https://github.com/CodexploreRepo
[3:10] Hướng dẫn cài đặt và sử dụng Anaconda
Link: https://www.anaconda.com/
[4:35] Hướng dẫn sử dụng Jupyter Notebook
[8:00] pd.read_csv()
[10:15] df.shape
[11:10] df.info()
[12:35] df.columns
[13:15] df.index
[14:00] df.describe()
[16:38] .loc()
[22:45] .iloc()
[26:59] .dtype
[28:14] .apply()
[32:50] Nhân các column trong Data Frame và tạo Column mới
[36:36] .groupby()
[38:59] .sort_values()
[40:45] .value_count()
[41:39] .nuique()

Full Series "Tự Học Data Science Cho Người Mới Bắt Đầu":    • Tự Học Data Science Cho Người Mới Bắt...  

Group Hỏi Đáp:   / 204281000722812  

------------ ✪ About CodeXplore Channel ✪ -----------
CodeXplore là một platform chia sẻ kiến thức về Lập Trình [Coding] dành cho các bạn trẻ Việt Nam từ một cựu du học sinh Sing, hiện đang sống và làm việc tại Singapore.

Channel của mình sẽ focus vào các chủ đề sau:
► [Code] Lập Trình Web - Full-Stack (HTML, CSS, JavaScript, Node JS và React JS) ☞ Future Projects: Deno
► [Code] Interview Preparation (Cấu Trúc Dữ Liệu và Thuật Toán & LeetCode Solutions)
► [Code] Lập Trình Python (Cơ Bản, Lập Trình Hướng Đối Tượng, Lập Trình Game)

► [Xplore] Travel Vlog (Chia sẻ kinh nghiệm đi du lịch và trải nghiệm)
------------------
✪ Business inquiries: [email protected]
✪ Subscribe: https://bit.ly/youtube_codexplore

➥ CodeXplore Social Links:
Fanpage:   / codexplore.dev  
Instagram:   / codexplore.dev  
GitHub: https://github.com/CodexploreRepo

---------------------------------------------/------------
© Bản quyền thuộc về CodeXplore
© Copyright by CodeXplore ☞ Do not Reup

#JupyterNotebook #Pandas #DataScience

Комментарии

Информация по комментариям в разработке