84669 人学习
152542 人学习
20005 人学习
5487 人学习
7821 人学习
359900 人学习
3350 人学习
180660 人学习
48569 人学习
18603 人学习
40936 人学习
1549 人学习
1183 人学习
32909 人学习
python下利用有利用css的font-family属性来提取html字符串的库吗?用来做字体子集化。
你问的问题有一点模糊,若是使用CSS Selector取html内的内容,可以用lxml.cssselect,中文说明还有这有,且不只是用lxml
font-family只是指定使用的字体。
你想做的是对一篇HTML计算一共有多少个汉字,然后动态或者半静态生成只包含这些字的提及比较小的汉字字体远程下载使用?
如果只是计算汉字,其实python下面的set是最简单的。
但是要生成对应的字库就是大坑了。目前方正有类似的服务,似乎叫云字库,之前询过价,对方老实表示问题还不少。
你问的问题有一点模糊,若是使用CSS Selector取html内的内容,可以用lxml.cssselect,中文说明还有这有,且不只是用lxml
font-family只是指定使用的字体。
你想做的是对一篇HTML计算一共有多少个汉字,然后动态或者半静态生成只包含这些字的提及比较小的汉字字体远程下载使用?
如果只是计算汉字,其实python下面的set是最简单的。
但是要生成对应的字库就是大坑了。目前方正有类似的服务,似乎叫云字库,之前询过价,对方老实表示问题还不少。