Tăng cường - Tổng quan, Biểu mẫu, Ưu và Nhược điểm, Cây tùy chọn

Tăng cường là một thuật toán giúp giảm phương sai và thiên vị trong một nhóm học máy. Thuật toán Thuật toán (Algos) Thuật toán (Algos) là một tập hợp các hướng dẫn được giới thiệu để thực hiện một nhiệm vụ. bằng cách kết hợp N số người học.

Thúc đẩyNguồn: Sirakorn [CC BY-SA]

Thúc đẩy cũng có thể cải thiện dự đoán mô hình cho các thuật toán học. Những học viên yếu kém sẽ được những người đi trước sửa chữa tuần tự và trong quá trình đó, họ được chuyển đổi thành những học viên giỏi.

Các hình thức thúc đẩy

Thúc đẩy có thể có một số hình thức, bao gồm:

1. Tăng cường thích ứng (Adaboost)

Adaboost nhằm mục đích kết hợp một số người học yếu để tạo thành một người học mạnh duy nhất. Adaboost tập trung vào những người học yếu, thường là những cây quyết định chỉ có một lần tách và thường được gọi là gốc quyết định. Cơ sở quyết định đầu tiên trong Adaboost chứa các quan sát có trọng số như nhau.

Các lỗi trước đó được sửa chữa và bất kỳ quan sát nào được phân loại không chính xác sẽ được ấn định nhiều trọng số hơn các quan sát khác không có lỗi trong phân loại. Các thuật toán từ Adaboost được sử dụng phổ biến trong các thủ tục hồi quy và phân loại. Một lỗi nhận thấy trong các mô hình trước đó được điều chỉnh theo trọng số cho đến khi đưa ra dự đoán chính xác.

2. Tăng cường Gradient

Tăng cường Gradient, giống như bất kỳ quy trình học máy tập hợp nào khác, tuần tự thêm các yếu tố dự đoán vào nhóm và tuân theo trình tự trong việc hiệu chỉnh các yếu tố dự đoán trước đó để đi đến một dự đoán chính xác vào cuối quy trình. Adaboost sửa các lỗi trước đó của nó bằng cách điều chỉnh trọng số cho mọi quan sát không chính xác trong mỗi lần lặp lại, nhưng tăng cường độ dốc nhằm mục đích điều chỉnh một công cụ dự đoán mới trong các lỗi còn lại do công cụ dự đoán trước đó phạm phải.

Tăng cường độ dốc sử dụng quá trình giảm độ dốc để xác định chính xác những thách thức trong dự đoán của người học được sử dụng trước đây. Lỗi trước được đánh dấu và, bằng cách kết hợp một người học yếu với người học tiếp theo, lỗi sẽ giảm đáng kể theo thời gian.

3. XGBoost (Tăng cường độ dốc cực cao)

XGBoostimg triển khai cây quyết định với độ dốc được tăng cường, hiệu suất và tốc độ nâng cao. Việc triển khai các máy tăng độ dốc tương đối chậm, do việc đào tạo mô hình phải theo một trình tự. Do đó, họ thiếu khả năng mở rộng Khả năng mở rộng Khả năng mở rộng có thể rơi vào cả bối cảnh tài chính và chiến lược kinh doanh. Trong cả hai trường hợp, nó là viết tắt của khả năng thực thể chịu được áp lực do sự chậm chạp của họ.

XGBoost phụ thuộc vào hiệu suất của một mô hình và tốc độ tính toán. Nó cung cấp nhiều lợi ích khác nhau, chẳng hạn như song song, tính toán phân tán, tối ưu hóa bộ nhớ cache và tính toán ngoài lõi.

XGBoost cung cấp khả năng song song trong xây dựng cây thông qua việc sử dụng các lõi CPU trong quá trình đào tạo. Nó cũng phân phối tính toán khi nó đang đào tạo các mô hình lớn bằng cách sử dụng các cụm máy. Tính toán ngoài lõi được sử dụng cho các tập dữ liệu lớn hơn không thể vừa với kích thước bộ nhớ thông thường. Tối ưu hóa bộ nhớ cache cũng được sử dụng cho các thuật toán và cấu trúc dữ liệu để tối ưu hóa việc sử dụng phần cứng có sẵn.

Ưu và nhược điểm của việc thúc đẩy

Là một mô hình tổng hợp, boost đi kèm với một thuật toán dễ đọc và diễn giải, giúp dễ dàng xử lý các diễn giải dự đoán của nó. Khả năng dự đoán hiệu quả thông qua việc sử dụng các phương pháp sao chép của nó, chẳng hạn như đóng gói Bagging (Bootstrap Aggregation) Học máy Ensemble chủ yếu có thể được phân loại thành đóng gói và tăng cường. Kỹ thuật đóng bao hữu ích cho cả rừng hồi quy và thống kê hoặc rừng ngẫu nhiên và cây quyết định. Tăng cường lực là một phương pháp đàn hồi giúp hạn chế việc mặc quần quá bó một cách dễ dàng.

Một bất lợi của việc tăng cường là nó nhạy cảm với các ngoại lệ vì mọi bộ phân loại đều có nghĩa vụ sửa các lỗi trong bộ phân loại trước đó. Do đó, phương pháp này quá phụ thuộc vào các yếu tố ngoại lai. Một nhược điểm khác là phương pháp này hầu như không thể mở rộng quy mô. Điều này là do mọi công cụ ước tính đều căn cứ vào tính đúng đắn của nó dựa trên các công cụ dự đoán trước đó, do đó làm cho quy trình trở nên khó đơn giản hóa.

Cây tùy chọn là gì?

Cây tùy chọn là cây thay thế cho cây quyết định. Chúng đại diện cho các bộ phân loại tổng hợp trong khi tạo ra một cấu trúc duy nhất. Sự khác biệt giữa cây tùy chọn và cây quyết định là cây trước bao gồm cả nút tùy chọn và nút quyết định, trong khi cây sau chỉ bao gồm các nút quyết định.

Việc phân loại một thể hiện yêu cầu lọc nó qua cây. Cần có nút quyết định để chọn một trong các nhánh, trong khi nút tùy chọn được yêu cầu để lấy toàn bộ nhóm nhánh. Điều này có nghĩa là, với một nút tùy chọn, một nút kết thúc với nhiều lá yêu cầu được kết hợp thành một phân loại để kết thúc bằng một dự đoán. Do đó, biểu quyết là bắt buộc trong quá trình này, trong đó đa số phiếu có nghĩa là nút được chọn làm dự đoán cho quá trình đó.

Quá trình trên làm rõ rằng các nút tùy chọn không nên đi kèm với hai tùy chọn vì chúng sẽ kết thúc bằng việc mất phiếu bầu nếu không tìm được người chiến thắng nhất định. Khả năng khác là lấy giá trị trung bình của các ước lượng xác suất từ ​​các con đường khác nhau bằng cách tuân theo các phương pháp tiếp cận như phương pháp Bayes hoặc phương pháp trung bình không trọng số.

Cây tùy chọn cũng có thể được phát triển từ việc sửa đổi các trình học cây quyết định hiện có hoặc tạo một nút tùy chọn trong đó một số phần tách có tương quan. Mọi cây quyết định nằm trong mức dung sai cho phép đều có thể chuyển thành cây quyền chọn.

Nhiêu tai nguyên hơn

Finance là nhà cung cấp chính thức Chứng nhận CBCA ™ Ngân hàng & Tín dụng được chứng nhận (CBCA) ™ Chứng chỉ CBCA ™ được Chứng nhận Ngân hàng & Nhà phân tích tín dụng (CBCA) ™ là tiêu chuẩn toàn cầu dành cho các nhà phân tích tín dụng bao gồm tài chính, kế toán, phân tích tín dụng, phân tích dòng tiền, mô hình giao ước, hoàn trả khoản vay và hơn thế nữa. chương trình chứng nhận, được thiết kế để biến bất kỳ ai thành nhà phân tích tài chính đẳng cấp thế giới.

Để tiếp tục học hỏi và phát triển kiến ​​thức của bạn về phân tích tài chính, chúng tôi thực sự khuyên bạn nên sử dụng các nguồn Tài chính bổ sung bên dưới:

  • Fintech (Công nghệ tài chính) Fintech (Công nghệ tài chính) Thuật ngữ fintech đề cập đến sức mạnh tổng hợp giữa tài chính và công nghệ, được sử dụng để tăng cường hoạt động kinh doanh và cung cấp các dịch vụ tài chính
  • Tài chính định lượng Tài chính định lượng Tài chính định lượng là việc sử dụng các mô hình toán học và các bộ dữ liệu cực lớn để phân tích thị trường tài chính và chứng khoán. Các ví dụ phổ biến bao gồm (1) việc định giá chứng khoán phái sinh như quyền chọn, và (2) quản lý rủi ro, đặc biệt vì nó liên quan đến quản lý danh mục đầu tư
  • Giả mạo Giả mạo Giả mạo Giả mạo là một phương thức giao dịch theo thuật toán gây rối loạn liên quan đến việc đặt giá thầu để mua hoặc đề nghị bán hợp đồng tương lai và hủy bỏ giá thầu hoặc đề nghị trước khi thực hiện giao dịch. Hoạt động này nhằm tạo ra một bức tranh sai lệch về nhu cầu hoặc sự bi quan giả tạo trên thị trường.
  • Hướng dẫn lương kỹ sư phần mềm Hướng dẫn lương kỹ sư phần mềm Trong hướng dẫn lương kỹ sư phần mềm này, chúng tôi đề cập đến một số công việc kỹ sư phần mềm và mức lương trung bình tương ứng của họ cho năm 2018. Kỹ sư phần mềm là người chuyên nghiệp áp dụng các nguyên tắc kỹ thuật phần mềm trong quá trình thiết kế, phát triển, bảo trì, kiểm tra và đánh giá phần mềm được sử dụng trong máy tính