在C#中獲取word文檔中的文本
Spire.Doc for .NET是一款專(zhuān)門(mén)對(duì) Word 文檔進(jìn)行操作的 .NET 類(lèi)庫(kù)。在于幫助開(kāi)發(fā)人員無(wú)需安裝 Microsoft Word情況下,輕松快捷高效地創(chuàng)建、編輯、轉(zhuǎn)換和打印 Microsoft Word 文檔。擁有近10年專(zhuān)業(yè)開(kāi)發(fā)經(jīng)驗(yàn)Spire系列辦公文檔開(kāi)發(fā)工具,專(zhuān)注于創(chuàng)建、編輯、轉(zhuǎn)換和打印Word/PDF/Excel等格式文件處理,小巧便捷。
有時(shí)我們?cè)谔幚硇畔⒘亢艽蟮膚ord文檔時(shí),只需要從word文檔中獲取文本以供其他使用。在 Spire.Doc 的幫助下,我們已經(jīng)演示了如何通過(guò)遍歷 word 文檔中的每個(gè)段落然后相應(yīng)地附加文本來(lái)從 word 文檔中提取文本。本文將向您展示如何使用 doc.GetText() 的方法直接從包含文本、圖像和表格的 word 文檔中提取文本。更方便開(kāi)發(fā)者從代碼中提取word文檔中的文本。
首先,查看將首先提取文本的示例word文檔:
第 1 步:創(chuàng)建一個(gè) word 實(shí)例并從文件中加載源 word 文檔。
Document doc = new Document(); doc.LoadFromFile("Sample.docx");
第 2 步:調(diào)用 doc.GetText() 方法從 word 文檔中獲取所有文本。
string s = doc.GetText();
第 3 步:創(chuàng)建一個(gè)新的 TEXT 文件以保存提取的文本。
File.WriteAllText("Extract.txt", s.ToString());
從word文檔中獲取所有文本后的有效截圖:
完整代碼:
using Spire.Doc; using System.IO; namespace GetText { class WordText { public void GetText() { Document doc = new Document(); doc.LoadFromFile("Sample.docx"); string s = doc.GetText(); File.WriteAllText("Extract.txt", s.ToString()); } } }
以上便是如何在C#中獲取word文檔中的文本,如果您有其他問(wèn)題也可以繼續(xù)瀏覽本系列文章,獲取相關(guān)教程,你還可以給我留言或者加入我們的官方技術(shù)交流群。