C#提取PPT文本和图片的实现方法

作者:E-iceblue 时间:2022-10-28 08:02:59 

在图文混排的文档中,我们可以根据需要将文档中的文字信息或者图片提取出来,通过C#代码可以提取Word和PDF文件中的文本和图片,那么同样的,我们也可以提取PPT幻灯片当中的文本和图片。本篇文档将讲述如何使用C#来实现提取PPT文本和图片的操作。首先也是需要安装组件Spire.Presentation,然后添加引用dll文件到项目中。下面是主要的代码步骤。

原文档:

C#提取PPT文本和图片的实现方法

1. 提取文本

步骤一:创建一个Presentation实例并加载文档


Presentation presentation = new Presentation(@"C:\Users\Administrator\Desktop\sample.pptx", FileFormat.Pptx2010);

步骤二:创建一个StringBuilder对象


StringBuilder sb = new StringBuilder();

步骤三:遍历幻灯片及幻灯片中的图形,提取文本内容


foreach (ISlide slide in presentation.Slides)
 {
 foreach (IShape shape in slide.Shapes)
 {
  if (shape is IAutoShape)
  {
  foreach (TextParagraph tp in (shape as IAutoShape).TextFrame.Paragraphs)
  {
   sb.Append(tp.Text + Environment.NewLine);
  }
  }
 }
 }

步骤四:写入Txt文档


File.WriteAllText("target.txt", sb.ToString());
Process.Start("target.txt");

C#提取PPT文本和图片的实现方法

2. 提取图片

 这里提取图片有两种情况,一种是提取整个文档中的所有图片,另外一种是只提取文档中某一特定幻灯片中的图片。

2.1提取所有图片

步骤一:初始化一个Presentation类实例,并加载文档


Presentation ppt = new Presentation();
ppt.LoadFromFile(@"C:\Users\Administrator\Desktop\sample.pptx");

步骤二:遍历文档中图片,提取图片并保存


for (int i = 0; i < ppt.Images.Count; i++)
{
Image image = ppt.Images[i].Image;
image.Save(string.Format(@"..\..\Images{0}.png", i));
}

C#提取PPT文本和图片的实现方法

提取的图片已保存到项目文件夹下

2.2.提取特定幻灯片中的图片

步骤一:创建一个Presentation类实例,并加载文档


Presentation PPT = new Presentation();
PPT.LoadFromFile(@"C:\Users\Administrator\Desktop\sample.pptx");

步骤二:获取第三张幻灯片,提取并保存图片


int i = 0;
foreach (IShape s in PPT.Slides[2].Shapes)
{
if (s is SlidePicture)
{
SlidePicture ps = s as SlidePicture;
ps.PictureFill.Picture.EmbedImage.Image.Save(string.Format("{0}.png", i));
i++;
}
if (s is PictureShape)
{
PictureShape ps = s as PictureShape;
ps.EmbedImage.Image.Save(string.Format("{0}.png", i));
i++;
}
}

提取的第三张幻灯片中的图片已保存至指定位置

C#提取PPT文本和图片的实现方法

上文演示了如何提取文本和图片,步骤比较简单实用,希望对你有所帮助,感谢阅读!

来源:http://www.cnblogs.com/Yesi/archive/2017/11/02/7770802.html

标签:C#,PPT
0
投稿

猜你喜欢

  • C#学习笔记整理_深入剖析构造函数、析构函数

    2022-10-26 18:37:20
  • C#中使用IrisSkin2.dll美化WinForm程序界面的方法

    2023-11-25 20:45:58
  • Android编程设计模式之中介者模式详解

    2022-04-05 21:13:03
  • go语言题解LeetCode88合并两个有序数组示例

    2023-10-23 00:55:10
  • 轻松学习C#的String类

    2021-06-21 02:03:06
  • Java Servlet3.0异步处理问题

    2023-08-12 00:52:05
  • Android 自定义AlertDialog对话框样式

    2022-02-06 12:20:07
  • Java JVM字节码指令集总结整理与介绍

    2021-09-18 17:10:20
  • Java使用线程同步解决线程安全问题详解

    2022-02-28 02:03:24
  • jar命令的用法详解

    2022-08-14 13:37:28
  • Android绘制动态折线图

    2021-12-28 12:59:50
  • Mybatis order by 动态传参出现的问题及解决方法

    2022-07-26 04:13:09
  • 彻底解决tomcat中文乱码问题方案

    2023-06-25 17:24:46
  • C#实现登录窗口(不用隐藏)

    2021-11-21 09:30:24
  • c#创建windows服务(Windows Services)详细步骤

    2023-06-11 19:05:22
  • java根据模板导出PDF的详细实现过程

    2022-04-07 21:48:52
  • C#基于NPOI生成具有精确列宽行高的Excel文件的方法

    2022-12-18 13:32:46
  • 深入解析Jdk8中Stream流的使用让你脱离for循环

    2023-03-01 21:50:43
  • C# 关于爬取网站数据遇到csrf-token的分析与解决

    2023-07-25 06:25:39
  • Java 多线程同步 锁机制与synchronized深入解析

    2023-12-20 17:55:50
  • asp之家 软件编程 m.aspxhome.com