Download Extract Text 4.1.0.0 – Phần mềm trích xuất văn bản từ tập tin
Download Extract Text 4.1.0.0 – Phần mềm trích xuất văn bản từ tập tin
Extract Text là phần mềm giúp trích xuất văn bản từ nhiều loại tài liệu, được thiết kế dựa trên công nghệ Microsoft Index Server để tạo chỉ số cho văn bản, hỗ trợ tìm kiếm nội dung dễ dàng.
Giao diện dòng lệnh của phần mềm Extract Text
Extract Text sử dụng công nghệ iFilters, hoạt động như plugin để gắn chỉ số cho dữ liệu, hỗ trợ bộ tìm kiếm tìm nội dung qua từ khóa. Phần mềm có giao diện dòng lệnh đơn giản.
Chỉ cần cung cấp tên tập tin để trích xuất văn bản và tên tập tin mới để lưu trữ. Trước khi cài đặt, đảm bảo máy tính có .NET Framework 4.0. Extract Text không cần cài đặt, chỉ cần giải nén và sao chép vào thư mục mong muốn.
Bộ lọc PDF Filter DLL cần có để trích xuất văn bản từ file PDF đã có sẵn trong Adobe Reader 7.0.5 cho tới 9. Từ sau Adobe Reader 10 (hay Adobe Reader X) thì gói DLL này không bao gồm sẵn trong Adobe Reader nữa. Tuy vậy thì bạn vẫn có thể trích xuất văn bản từ file PDF của Adobe hoặc các sản phẩm trình đọc PDF khác bởi Adobe có phát hành riêng bộ lọc Adobe iFilter.
Để trích xuất văn bản từ tập tin của Microsoft Office thì bạn cũng chỉ cần có các gói Filter Pack mà Microsoft cung cấp, cho phép trích xuất văn bản từ các định dạng file DOCX, DOCM, PPTX, PPTM, XLSX, XLSM, XLSB, ZIP, ONE, VDX, VSD, VSS, VST, VSX và VTX.
Phần mềm được cung cấp hoàn toàn miễn phí cho người dùng. Phiên bản mới nhất của Extract Text có hỗ trợ cả bộ lọc 32-bit và 64-bit, sử dụng .NET Framework 4.0 thay vì 2.0 như trước đó.
Thuy Nguyen


