officeParser: یه کتابخونه برای پارس همه فرمتهای آفیس
officeParser یه کتابخونه Node.jsه که میتونه فایلهای DOCX، XLSX، PPTX، PDF، RTF و فرمتهای OpenDocument رو پارس کنه و محتوا، متادیتا و پیوستها رو به صورت یه درخت ساختاریافته (AST) برگردونه. این کتابخونه هم سمت سرور و هم توی مرورگر کار میکنه و حتی OCR با Tesseract.js هم داره. تا الان بیش از ۱۰ میلیون بار دانلود شده و هفتهای بیش از ۲۶۰ هزار بار استفاده میشه. برای توسعهدهندههایی که فقط دنبال استخراج متن خالی نیستن و به ساختار کامل سند نیاز دارن، گزینه خوبیه.
این محتوا بهصورت خودکار با استفاده از هوش مصنوعی تولید شده است. بررسی نهایی آن پیش از استفاده توصیه میشود و مسئولیت استفاده از آن بهعهده کاربر است. برای مطالعه متن اصلی خبر،اینجا را کلیک کنید




