Go 语言 文本处理


程序 离不开文本字符串 Go 中 string 内置类型 与普通的 slice 类型有 相似的性质
例如 进行切片 slice 操作 使得 Go 中少了一些处理 string 类型的函数  没有 substring 这样的函数  却能够很方便的进行这样的操作

Go 标准库 有专门处理文本包
strings  包提供 操作 字符串的函数 字符串操作需求
strconv 包提供 基本 数据类型和字符串之间的转换
Go没有隐式类型转换  类型转换      int32(i) 将 i (比如为 int 类型)转换为 int32  字符串类型和 int float bool 等类型之间的转换 没有这么简单

Go 正则表达式

regexp 包提供 正则表达式功能 复杂的文本处理
语法基于 RE2  regexp/syntax 子包进行正则表达式解析
Go 代码用 UTF-8 编码 不能带BOM   标识符支持 Unicode 字符 在标准库 unicode 包及其子包 utf8 utf16中 提供了对 Unicode 相关编码 解码的支持
提供了测试 Unicode 码点 Unicode code points 属性的功能

字符集的转换

第三方库 mahonia 纯 Go 语言实现的字符集转换库 以方便需要进行字符集转换


Go 语言 文本处理和text相关