0(0)

Capstone: Retrieving, Processing, and Visualizing Data with Python

Course Prerequisite(s)

Description

Học viên sẽ xây dựng một loạt các ứng dụng để truy xuất, xử lý và trực quan hóa dữ liệu bằng Python. Các dự án sẽ liên quan đến tất cả các yếu tố của chuyên ngành. Trong phần đầu tiên của Capstone, học viên sẽ thực hiện một số bài toán để làm quen với các công nghệ đang được sử dụng và sau đó sẽ tập trung làm dự án của riêng mình để làm việc với một số dữ liệu khác mà họ có hoặc có thể tìm thấy. Chương 15 và 16 của cuốn sách “Python for Everybody” sẽ đóng vai trò là xương sống cho capstone. Khóa học này bao gồm Python 3.

Khóa cuối cùng trong chuỗi khóa học Python for Everybody Specialization

What Will I Learn?

  • Sử dụng biểu thức chính quy để trích xuất dữ liệu từ chuỗi
  • Hiểu các giao thức mà trình duyệt web sử dụng để truy xuất tài liệu và ứng dụng web
  • Truy xuất dữ liệu từ các trang web và API bằng Python
  • Làm việc với dữ liệu XML (Ngôn ngữ đánh dấu eXtensible)

Topics for this course

09h

Welcome to the Capstone?

Congratulations to everyone for making it this far. Before you begin, please view the Introduction video and read the Capstone Overview. The Course Resources section contains additional course-wide material that you may want to refer to in future weeks.

Building a Search Engine?

This week we will download and run a simple version of the Google PageRank Algorithm and practice spidering some content. The assignment is peer-graded, and the first of three optional Honors assignments in the course. This a continuation of the material covered in Course 4 of the specialization, and is based on Chapter 16 of the textbook.

Exploring Data Sources (Project)?

The optional Capstone project is your opportunity to select, process, and visualize the data of your choice, and receive feedback from your peers. The project is not graded, and can be as simple or complex as you like. This week's assignment is to identify a data source and make a short discussion forum post describing the data source and outlining some possible analysis that could be done with it. You will not be required to use the data source presented here for your actual analysis.

Spidering and Modeling Email Data?

In our second optional Honors assignment, we will retrieve and process email data from the Sakai open source project. Video lectures will walk you through the process of retrieving, cleaning up, and modeling the data.

Accessing New Data Sources (Project)?

The task for this week is to make a discussion thread post that reflects the progress you have made to date in retrieving and cleaning up your data source so can perform your analysis. Feedback from other students is encouraged to help you refine the process.

Visualizing Email Data?

In the final optional Honors assignment, we will do two visualizations of the email data you have retrieved and processed: a word cloud to visualize the frequency distribution and a timeline to show how the data is changing over time.

Visualizing new Data Sources (Project)?

This week you will discuss the analysis of your data to the class. While many of the projects will result in a visualization of the data, any other results of analyzing the data are equally valued, so use whatever form of analysis and display is most appropriate to the data set you have selected.

About the instructor

0 (0 ratings)

40 Courses

0 students

Free

Material Includes

  • Sách giáo khoa: “Python for everybody”
  • 38 videos
  • Khác: Bài đọc, Kiểm tra
  • Free (Audit)/ Paid Certificate

Enrolment validity: Lifetime

Requirements

  • Đọc lý thuyết trong sách giáo khoa chương 15-16
  • Hoàn thành 4 khóa đầu tiên của chuỗi khóa học Python for Everybody Specialization
  • Nếu không hoàn thành thì có kiến thức tương đương.

Target Audience

  • Coder
  • Programmer
  • Data Analyst
  • Data Scientist

Want to receive push notifications for all major on-site activities?