Amazon Web Services (AWS) vừa ra mắt CORD-19 Search, một trang tìm kiếm mới vận hành dựa trên machine learning (máy học), có thể giúp các nhà nghiên cứu nhanh chóng và dễ dàng tìm kiếm hàng vạn tài liệu và công trình nghiên cứu chỉ với các câu hỏi ngôn ngữ tự nhiên.
Tìm kiếm CORD-19 được xây dựng dựa trên bộ dữ liệu này, ban đầu bao gồm khoảng 24.000 tài liệu nghiên cứu và khoa học về Covid-19, SARS-CoV-2 và Coronavirus. Kể từ khi ra mắt, bộ dữ liệu CORD-19 đã tăng gần gấp đôi tới 47.000 công trình và tài liệu nghiên cứu từ các tạp chí thẩm định và máy chủ lưu trữ uy tín.
CORD-19 Search sẽ giúp các nhà nghiên cứu điều hướng tài liệu Coronavirus đang gia tăng nhanh chóng để tìm kiếm các thông tin liên quan và cập nhật một cách hiệu quả. CORD-19 Search cũng cung cấp một giao diện tìm kiếm đơn giản, giúp các nhà nghiên cứu có thể sử dụng dễ dàng.
CORD-19 Search sử dụng các dịch vụ học máy của AWS để tăng cường các kết quả toàn diện và khả thi. Bộ dữ liệu ban đầu đã được phong phú hơn với Amazon Comprehend Medical, một dịch vụ xử lý ngôn ngữ tự nhiên sử dụng học máy để trích xuất các thông tin y tế liên quan từ các dữ liệu văn bản phi cấu trúc về dịch bệnh, điều trị và dòng thời gian.
Sau đó dữ liệu này được ánh xạ tới các mô hình điều trị và chủ đề y tế liên quan tới Covid-19, sử dụng một mô hình phân loại đa nhãn và suy luận, chẳng hạn như virus học, miễn dịch học và các thử nghiệm lâm sàng. Thông tin sau đó được lập chỉ mục trong Amazon Kendra, một dịch vụ tìm kiếm doanh nghiệp có độ chính xác cao dựa trên máy học, cung cấp các tính năng truy vấn ngôn ngữ tự nhiên mạnh mẽ giúp tìm kiếm và xếp hạng các bài viết liên quan dễ dàng hơn.
Hiện tại, CORD-19 Search đang được cung cấp miễn phí tại địa chỉ https://cord19.aws.
Thành Luân