1. Giới thiệu thư viện Numpy trong Python
Numpy (viết tắt của từ: numeric python) được tạo ra bởi Travis Oliphant vào năm 2005 – đây là một mô-đun Python được sử dụng chủ yếu trong việc tính toán và xử lý với các phần tử mảng một chiều và đa chiều. Numpy được xây dựng chủ yếu trên ngôn ngữ C và C++, vì thế mà Numpy có khả năng thực hiện các phép tính số với tốc độ cao.
Numpy cung cấp nhiều cấu trúc dữ liệu mạnh mẽ khác nhau nhằm mục đích triển khai các ma trận và mảng đa chiều. Các cấu trúc dữ liệu này được sử dụng cho các tính toán tối ưu liên quan đến mảng và ma trận. Với khả năng tính toán cao, giúp cho Numpy thường được sử dụng cho nhiều mục đính liên quan đến xử lý dữ liệu số (xử lý dữ liệu). Một số những ưu điểm sau khi sử dụng NumPy để phân tích dữ liệu:
- NumPy thực hiện tính toán hướng mảng.
- NumPy hiện hiệu quả các mảng đa chiều.
- NumPy hiện các phép tính khoa học một cách dễ dàng.
- NumPy có khả năng thực hiện Fourier Transform và định hình lại dữ liệu được lưu trữ trong các mảng đa chiều.
- NumPy cung cấp các hàm tích hợp cho đại số tuyến tính và tạo số ngẫu nhiên.
Ngày nay, khi thực hiện các thao tác với data science người ta thường sẽ sử dụng thư viện NumPy kết hợp với SciPy và Mat-plotlib để thay thế cho MATLAB bởi vì các thư viện trên đều có thể chạy trên Python và ngôn ngữ lập trình này hoàn chỉnh hơn và dễ dàng hơn MATLAB.
2. Cài đặt Numpy trong Python
Thư viện Numpy không có sẵn trong Python. Vì vậy, để cài đặt Numpy về máy, bạn cần mở command line (CMD) và gõ từ khóa cài đặt Numpy bên dưới:
pip install numpy
Sau khi việc cài đặt Numpy từ command line hoàn tất, bạn có thể nhập thư viện này vào chương trình hay dự án của bạn như sau:
import numpy as np
Khi nhập Numpy vào trong chương trình của bạn, bạn có thể hoàn toàn sử dụng các phương thức, các hàm được cung cấp trong thư viện cho các mục đính xử lý, tính toán trong Python. Ví dụ dưới đây, khai báo thư viện Numpy trong chương trình Python và kiểm tra phiên bản hoạt động của Numpy vừa cài đặt.
import numpy as np print("Phien ban Numpy " + np.__version__)
Kết quả:
Phien ban Numpy 1.22.3
Lưu ý: Chúng ta nên cài đặt phiên bản Numpy mới nhất để có đầy đủ các chức năng hơn.
3. Ví dụ Numpy trong Python
Các ví dụ đơn giản dưới đây nhằm mục đính kiểm tra xem Numpy đã thực sự đã được cài đặt trên máy của bạn hay chưa. Các ví dụ này cũng là những câu lệnh thường xuyên xử dụng khi thao tác với Numpy trong Python.
Ví dụ tạo một mảng với các phần tử là các số nguyên bằng cách sử dụng hàm Numpy.array() như sau:
import numpy as np # Tao mang arrA voi Numpy arrA = np.array([1, 2, 3, 4, 5]) # Cac phan tu trong mang la so nguyen # Hien thi mang arrA print(arrA)
Kết quả:
[1 2 3 4 5]
Ví dụ tiếp theo tạo ra 2 mảng với Numpy và thực hiện tính toán các phép tính cộng , trừ, nhân, chia giữa hai mảng như sau:
import numpy as np # Tao mang arrA voi Numpy arrA = np.array([1, 2, 3, 4, 5]) # Tao mang arrB voi Numpy arrB = np.array([6, 7, 8, 9, 10]) # Phep toan cong giua hai mang arrC = arrA + arrB print("arrA + arrB: {0}".format(arrC)) # Phep toan tru giua hai mang arrC = arrA - arrB print("arrA - arrB: {0}".format(arrC)) # Phep toan nhan giua hai mang arrC = arrA * arrB print("arrA * arrB: {0}".format(arrC)) # Phep toan chia giua hai mang arrC = arrA / arrB print("arrA / arrB: {0}".format(arrC))
Kết quả:
arrA + arrB: [ 7 9 11 13 15] arrA - arrB: [-5 -5 -5 -5 -5] arrA * arrB: [ 6 14 24 36 50] arrA / arrB: [0.16666667 0.28571429 0.375 0.44444444 0.5 ]
Trong những bài tiếp theo, chúng ta sẽ đi chi tiết hơn về các hàm thao tác với mảng trong Numpy, ngoài ra chúng ta sẽ học cách sử dụng Numpy cho các tính toán giữa các mảng đa chiều. Mời bạn đọc đón xem!