当前位置: 首页 > news >正文

小地方的旅游网站怎么做dsp投放方式

小地方的旅游网站怎么做,dsp投放方式,党风建设网站,谷歌云 装wordpress🥰大家知道吗,之前在给AI大模型"喂数据"的时候,我们往往需要把非结构化数据(比如PDF、PPT、Excel等)自己手动转成结构化的格式,这可真是太累人儿了。🥵 幸好现在有了Unstructured这个神级库,它内置的数据提取函数可以帮我们快速高效地完成这个…

🥰大家知道吗,之前在给AI大模型"喂数据"的时候,我们往往需要把非结构化数据(比如PDF、PPT、Excel等)自己手动转成结构化的格式,这可真是太累人儿了。🥵

幸好现在有了Unstructured这个神级库,它内置的数据提取函数可以帮我们快速高效地完成这个转换过程。而且支持常见的多种文件格式!🐶

比如说,如果我们要从一个PPT文件里提取数据,可以用partition_pptx函数:

from unstructured.partition.pptx import partition_pptxfilename = "example_files/msft_openai.pptx"
elements = partition_pptx(filename=filename)

这个函数会把PPT文件的内容解析成一个elements列表,每个元素都是一个Element对象,分别代表PPT里的标题、文字、图片等内容。

但是我们想要的是结构化数据而不是对象呀,所以还需要再转换一下:

element_dict = [el.to_dict() for el in elements]
print(json.dumps(element_dict, indent=2))

这两行代码的作用是:

  1. 遍历elements列表,把每个Element对象都转换成字典(调用它们的to_dict方法)
  2. 把这些字典组成一个新列表element_dict
  3. 使用json.dumpselement_dict转成Json格式的字符串,并指定indent=2让结果更加美观

是不是很酷?现在我们就拥有了结构化的数据啦!

如果是PDF文件的话,流程也差不多:

from unstructured.shared import Files, PartitionParameters
from unstructured.openai_api import SDKfilename = "example_files/CoT.pdf"
with open(filename, "rb") as f:files = Files(content=f.read(), file_name=filename)req = PartitionParameters(files=files, strategy='hi_res', pdf_infer_table_structure=True)s = SDK.get_instance() 
resp = s.general.partition(req)
print(json.dumps(resp.elements, indent=2))

这里主要新的地方是用Files对象来存PDF文件的内容,然后定义一个PartitionParameters来设置处理策略(比如识别表格等)。

最后就是创建SDK实例,调用partition方法,传入之前定义的参数,就能获取PDF里的结构化数据啦!

对于Excel文件,官方文档里也有介绍,应该也是类似的操作。

有了这些技能,我们就能把海量的非结构化数据高效地转换成结构化格式,喂给大模型"吃"啦!以后制作AI应用的时候,效率和开发体验都会更上一层楼~🚀

http://www.ds6.com.cn/news/41493.html

相关文章:

  • 什么静态网站容易做广东近期新闻
  • 淘宝客如何做淘宝客网站推广链接交换平台
  • 杭州做网点卖服装在那个网站网站站长工具
  • 高端建站收费标准seo优化方向
  • 聚美优品的pc网站建设网络营销方法有哪些
  • 北京网站排名优化软件外包公司好不好
  • 绍兴免费做网站长沙网
  • 西安网站建设公司找哪家培训学校加盟费用
  • 口碑好的网站建设商家小视频网站哪个可以推广
  • 亚洲男女做暖网站常德网站优化公司
  • 在电脑上做网站seo关键词优化哪个平台好
  • 猪八戒网可以做福彩网站吗外链平台
  • 上海c网站建设域名邮箱 400电话
  • 帝国做的网站怎么上传图片市场营销策划ppt
  • 怎么做网站banner网站客服
  • 网站从香港转到内地如何备案口碑营销的名词解释
  • 电子商务网站解决方案重庆seo全网营销
  • 宜昌做网站公司有哪些方法网络销售就是忽悠人
  • 做网站设计管理的专业营销软文范例大全300
  • 网站建设与管理教学大纲网络营销与直播电商
  • dw做音乐网站生成关键词的软件免费
  • 湛江网站建设团队福州搜索引擎优化公司
  • 吴中区建设局网站宁波seo运营推广平台排名
  • 做网批的有什么网站呢网站开发软件有哪些
  • 手机商场网站制作seo关键词seo排名公司
  • 杭州定制网站制作软文写作要求
  • 温州网站开发设计网站接单
  • 网站通栏广告设计建站系统有哪些
  • 做毕业论文设计的网站拼多多关键词排名查询
  • dede做购物网站舆情信息在哪里找