Nói về đạo hàm, như các bạn học ở lớp 11, 12 thì đạo hàm biểu thị tốc độ thay đổi của hàm. Ví dụ hàm có đạo hàm là để biểu thị tỉ lệ thay đổi của hàm khi biến đầu vào (input) thay đổi một lượng rất nhỏ . Đối với đồ thị trên mặt phẳng tọa độ, đạo hàm tại một điểm trên đồ thị bằng độ dốc của đường biểu diễn đồ thị đó. Chính vì thế mới có nguyên tắc tìm tiếp tuyến của đồ thị tại một điểm bằng cách tính đạo hàm. Nếu bạn từng làm gà chọi thi đại học, mấy cái mình nói ra ở đây chắc hẳn quá quen thuộc với bạn rồi.
Đạo hàm như vậy là đạo hàm thông thường (ordinary derivative).
Đạo hàm riêng (partial derivative) cũng hoạt động trên nguyên tắc tương tự.
Đạo hàm riêng theo biến , ký hiệu là hoặc sẽ được tính giống như đạo hàm bình thường nếu ta xem tất cả các biến khác là hằng số. Với đạo hàm thường ta dùng chữ , đạo hàm riêng ta dùng chữ (đọc là "del" hoặc "partial").
Khi xem là hằng số, mình sẽ dùng một mặt phẳng, chẳng hạn , để cắt đồ thị , để lại giao tuyến là đường
Lợi ích của việc dùng đạo hàm riêng là mình có thể quan sát được sự biến động của hàm khi chỉ thay đổi một biến và giữ nguyên các thông số input còn lại. Để có đầy đủ thông tin về tốc độ thay đổi đó, chúng ta cần phải biết các biến được giữ nguyên là biến nào và có giá trị giữ nguyên bằng mấy, sau đó thay các giá trị này vào.
Theo ví dụ trên thì:
- Đạo hàm riêng theo biến của đại lượng khi là .
- Tại điểm trên mặt phẳng , đạo hàm riêng theo biến bằng .
- Tức là tại điểm đó, nếu bạn giữ nguyên và dịch chuyển một lượng rất nhỏ bằng thì đại lượng cũng sẽ thay đổi một lượng, nhưng gấp 4 lần mà bạn thay đổi với .
- Chính vì vậy ta viết .
Gradient của hàm với là một vector:
Mình không biết dịch "directional derivative" ra tiếng Việt như thế nào nên dịch thô thiển như vậy thôi. Đạo hàm có hướng có nhiều ý nghĩa và chức năng khác nhau, trong bài này chỉ nói đến việc mô tả tốc độ thay đổi của hàm.
Đạo hàm có hướng là một dạng tổng quát của đạo hàm riêng. Nếu đạo hàm riêng chỉ có thể xét cho sự thay đổi của một biến thì đạo hàm có hướng xét sự thay đổi của nhiều biến.
Mình sẽ nhóm các biến vào một vector, tức là thay vì ghi thì ghi và ngầm hiểu .
Do mình có 2 biến nên không gian input của mình sẽ là mặt phẳng. Không gian output của hàm là một tia số. Hàm làm nhiệm vụ "nối" một điểm trong không gian input đến một điểm trong không gian output, các bạn cứ tạm hình dung giống như ánh xạ vậy nhé.
Giả sử mình có một vector , câu hỏi đặt ra là nếu điểm trong không gian input của mình bị đẩy lệch đi một ít theo chiều của vector , thì điểm trong không gian output của mình sẽ bị lệch đi bao nhiêu lần?
Quan sát hình sau. Hai điểm cùng màu là một bộ input-output tương ứng nhau cho hàm . Ví dụ ở bên trái, điểm màu đỏ làm input thì sẽ cho điểm màu đỏ ở ảnh phải có giá trị . Bây giờ nếu trong hình trái, mình dời điểm màu đỏ sang vị trí điểm màu xanh theo hướng (chỉ hướng thôi nhé, còn khoảng cách được quyết định bởi ) của , thì ở hình bên phải độ dời đó sẽ gấp bao nhiêu lần so với bên trái?
Từ đó nảy sinh ra ký hiệu , hoặc và đạo hàm có hướng. Nếu bạn nắm được cách tính đạo hàm bình thường, chắc chắn cách tính sau sẽ không có gì đáng ngạc nhiên:
Một số tài liệu sẽ định nghĩa khác một tí, chỉ xét đến chiều của vector và dùng để tính tốc độ thay đổi của hàm:
Note:
À, ừm... đó là vì để đảm bảo mình luôn xét sự dịch chuyển theo vector đơn vị (vector có độ dài bằng 1). Nếu bạn chưa hiểu thì hãy tưởng tượng nhé. Trong ví dụ trên, dù ta lấy hay chúng ta đều mong muốn ra một giá trị duy nhất, đúng không? Vì mục tiêu lúc này của đạo hàm hướng là mô tả sự thay đổi của hàm khi thay đổi input theo một chiều nhất định.
Một số người còn xét đến độ lớn của và cho rằng nếu nó càng lớn thì tốc độ tăng cũng phải lớn theo. Mình đã có thử đặt câu hỏi này trên Reddit và trên Quora. Hóa ra là nó tạo sự thuận tiện cho các tính chất khác :)) ("because it's mathematically convenient!"). Nếu có dịp mình sẽ nghiên cứu sâu thêm mảng này. Tạm thời bây giờ, nếu đơn thuần tính tốc độ hàm thì mình cần dùng vector đơn vị, với lý do đã đề cập ở trên.
Theo ví dụ trên thì:
Tại các điểm input cụ thể, bạn có thể thay vào và tính ra được đạo hàm hướng tại điểm đó, còn gọi là tính độ dốc (slope).
Tốc độ thay đổi của hàm :
Tại một điểm input cố định, hàm tăng nhanh nhất (max) khi cùng hướng với (tính chất tích vô hướng).
Do đó, người ta gọi gradient là chiều tăng nhanh nhất của hàm (direction of steepest ascent).
Các contour lines nằm sát nhau sẽ gần như song song và cách nhanh nhất di chuyển giữa hai đường song song là qua đường vuông góc chung. Cách đi này trùng với hướng gradient, hệ quả là, gradient luôn vuông góc với các đường contour lines.