博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
java 获取页面的编码
阅读量:6307 次
发布时间:2019-06-22

本文共 613 字,大约阅读时间需要 2 分钟。

今天遇到个问题,根据一个url获取页面,由于不知道页面的编码格式,需要自己在获得的页面中找到相应的charset,考虑使用正则表达式来获取,一下为获取编码的方法

1     /**2      * 由于获取页面的原始编码3      * @param htmlContent 页面的Content4      */5     public static String getChersetFromHtml(String htmlContent){6         String regex="^([\\s\\S]*)(
[\\s\\S]*)$";7 //获取第三个子表达式的内容8 return htmlContent.replaceAll(regex, "$3");9 }

 

这样就可以获得页面中的编码了。

参考资料:

  Java正则表达式详解

    html.replaceAll(regex, "$3"); 的活学活用
   java 中正则的运用
  JAVA Pattern和Matcher 的用法
   (重要)正则
JAVA Pattern和Matcher 的用法

当然不使用正则表达式也可以获取,但是有点繁琐,不推荐。

 

转载于:https://www.cnblogs.com/xiaozhihome/archive/2013/05/10/3071232.html

你可能感兴趣的文章
阅读Android源码的一些姿势
查看>>
Web语义化标准解读
查看>>
一份代码构建移动、桌面、Web全平台应用
查看>>
高性能 Lua 技巧(译)
查看>>
区分指针、变量名、指针所指向的内存
查看>>
异步编程的世界
查看>>
最近话题火爆的四件事你知道不?
查看>>
SpringBoot整合MyBatis
查看>>
云计算产业如何率先推行信用管理?
查看>>
Android 类库书签更新(一)
查看>>
Unity3D Input按键系统
查看>>
简单的一条SQL,不简单的做事思维 NOT IN 、NOT EXISTS、LEFT JOIN用法差别 ...
查看>>
DataWorks:任务未运行自助排查
查看>>
ionic/cordova热部署
查看>>
「镁客早报」特斯拉裁员,马斯克解释没有办法;微软推出Azure DevOps赏金计划...
查看>>
Flink入坑指南第五章 - 语法糖 view
查看>>
centos 7.4 使用 pgxc_ctl 安装与使用
查看>>
Redis 单key值过大 优化方式
查看>>
【数据库】表分区
查看>>
nutz-sqltpl 1.3.4.RELEASE 发布,在 Nutz 项目中“解决 Java 拼接 SQL”问题
查看>>