千家信息网

如何理解xHTML源码的DLL组件AngleSharp

发表于:2025-01-19 作者:千家信息网编辑
千家信息网最后更新 2025年01月19日,如何理解xHTML源码的DLL组件AngleSharp,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。AngleSharp是基于.NE
千家信息网最后更新 2025年01月19日如何理解xHTML源码的DLL组件AngleSharp

如何理解xHTML源码的DLL组件AngleSharp,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

AngleSharp是基于.NET(C#)开发的专门为解析xHTML源码的DLL组件。

项目地址:https://github.com/FlorianRappl/AngleSharp

我主要介绍是一些使用AngleSharp常用的方法,跟大家介绍,我会以站点作为原型。 其它的类似组件有:

国内:Jumony
github地址: https://github.com/Ivony/Jumony

国外:Html Agility Pack
项目地址:http://htmlagilitypack.codeplex.com/

具体大家可以自行搜索对比三者的区别和性能。接下来咱们主要讨论主角是AngleSharp

引入AngleSharp至项目,用NuGet工具执行命令(其实我是在装逼。) Install-Package AngleSharp

在项目中添加引用Using AngleSharp

首先我们获取CnBlogs首页的HTML源代码

static public string GetHtml(){  HttpWebRequest myReq =  (HttpWebRequest)WebRequest.Create("https://www.jb51.net");  HttpWebResponse response = (HttpWebResponse)myReq.GetResponse();  // Get the stream associated with the response.  Stream receiveStream = response.GetResponseStream();  // Pipes the stream to a higher level stream reader with the required encoding format.   StreamReader readStream = new StreamReader(receiveStream, Encoding.UTF8);  return readStream.ReadToEnd();}

获取jb51首页当前所有博客文章的标题

private static void Main(string[] args) { //找出所有文章标题 string cnblogsHtml = GetHtml();  //加载HTML  var document = DocumentBuilder.Html(cnblogsHtml);  //这里必须要使用== 不能使用Equals  var titleItemList = document.All.Where(m => m.ClassName == "titlelnk");  int iIndex = 1;  foreach (var element in titleItemList)  {    Console.WriteLine(iIndex + ":" + element.InnerHtml);    iIndex++;  }}

以上代码输出内容:

1:JNDI学习总结(三)--Tomcat下使用Druid配置JNDI数据源2:我们前端是怎么跟设计师沟通的3:MVC5+EF6 入门完整教程六4:试议常用Javascript 类库中 throttle 与 debounce 辅助函数的区别5:孤独的走过年轻6:上周热点回顾(11.10-11.16)7:Android动画-补间(Tween)动画8:朴素贝叶斯算法的python实现9:MVC三层级联方式10:C# 标签(条码)的打印与设计(一)11:OpenCASCADE Make Primitives-Box12:基于solr实现hbase的二级索引13:(十六)WebGIS中偏移补偿量引发的问题之探讨14:javascript小游戏--生命游戏15:Android动画-帧动画16:C# Socket学习笔记一17:lua表排序18:ZooKeeper系列 第一篇:ZooKeeper快速入门19:【插件开发】-- 9 编辑器代码分块着色-高亮显示!20:华盛顿大学计算机视觉课程笔记(一)

关于如何理解xHTML源码的DLL组件AngleSharp问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注行业资讯频道了解更多相关知识。

0