LEADTOOLS使用教程:使用AWS Lambda轉換文檔
工作場所中存在許多多頁的文件。能夠加載、拆分和提取是許多應用程序的重要需求。一些最常見的多頁文件類型是:PDF,TIFF和Microsoft Office格式,例如Docx,Doc,Xls和Xlsx。LEADTOOLS支持所有這些格式以及30多種其他多頁格式。由于存在多種不同類型的多頁格式,因此嘗試支持常見的格式可能會讓人頭疼,而試圖支持所有這些格式的也像一場噩夢。幸運的是,LEADTOOLS SDK可以用不到五行代碼來完成此應用程序。
LEADTOOLS (Lead Technology)由Moe Daher and Rich Little創建于1990年,其總部設在北卡羅來納州夏洛特。LEAD的建立是為了使Daher先生在數碼圖象與壓縮技術領域的發明面向市場。在過去超過30年的發展歷程中,LEAD以其在全世界主要國家中占有的市場領導地位,在數碼圖象開發工具領域中已成為既定的全球領導者。LEADTOOLS開發與發布的LEAD是屢獲殊榮的開發工具包。
借助AWS Lambda,您幾乎可以為任何類型的應用程序或后端服務運行代碼——只需進行零管理即可。您所需要做的就是上傳代碼,Lambda會處理運行和擴展代碼所需的一切。您可以從其他Amazon Web服務設置觸發器,也可以直接從任何Web或移動應用程序調用觸發器。
大多數LEADTOOLS功能都可以輕松添加到AWS Lambda。功能如文本識別,文檔轉換,條碼識別,圖像處理,以及AWS LAMBDA更多的是完美的配合。
這篇文章主要關注使文檔到文檔轉換成為可能的代碼。LEADTOOLS Document Converter組件在速度,準確性和可靠性方面處于市場領先地位。這些轉換庫具有在需要時與超過150種文檔和光柵圖像格式之間進行自動轉換的能力。
為AWS Lambda創建項目可能比創建一個簡單的桌面應用程序要花費一些時間,但是使用Lambda可以消除與管理和維護自己的服務器相關的麻煩。這篇文章僅介紹基礎知識,有關更多信息,請查看有關如何使用AWS Lambda轉換文檔的完整教程。
using (var document = DocumentFactory.LoadFromStream(stream, new LoadDocumentOptions())) { var ext = DocumentWriter.GetFormatFileExtension(request.DocumentFormat); var fileName = Path.Combine(@"/tmp", Path.ChangeExtension(Path.GetFileName(request.InputUrl), ext)); var jobData = DocumentConverterJobs.CreateJobData(document, fileName, request.DocumentFormat); var job = documentConverter.Jobs.CreateJob(jobData); documentConverter.Jobs.RunJob(job); if (job.Errors.Count > 0) foreach (var error in job.Errors) sw.WriteLine($@"Error during conversion: {error.Error.Message} {error.Error.StackTrace}"); }試試看!
要自己進行測試,請確保從我們的網站上免費獲得最新的LEADTOOLS SDK評估(如果尚未安裝)。該試用版有效期為60天。
請繼續關注,我們將繼續發布更多教程,程序員可以使用這些教程來開發直接影響數據捕獲,識別,交換和其他緊迫業務需求的應用程序。