使用R从字符串中提取特定格式的子字符串（ID，代码）

supercontra 发表于 Dev

超反

假设我有一个数据框，其中包含我使用twitteR收集的推文。我想提取一个子字符串，它是每个推特中包含的另一个数据集的唯一ID。所有ID的格式均相同，由3-4个大写字母组成，后跟一个连字符，然后是一个6位数字。示例为：YLD-000123，YLSL-000323，YLP-000135。我只需要ID，就可以在每条推文上删除其他所有内容。

这是我正在使用的推文的两个示例：

  st1="Elijo ENTERTIMER, YLC-000354, como ganador para  http://t.co/jclDk8d796 #YoungLionsCo #FantasyLions"
st2="Elijo #AEseTrenNoMeLeSubo, YLSL-000169, como ganador para  http://t.co/wPpM7X5ecN #YoungLionsCo #FantasyLions"
tweets=c(st1,st2)

我需要的结果是“ YLC-000354”“ YLSL-000169”。该ID并不总是在逗号之间。

博维尔上校

使用方法gsub：

gsub('.*[^[:alpha:]]([[:alpha:]]+-\\d+).*','\\1',tweets)
#[1] "YLC-000354"  "YLSL-000169"

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-21

我来说两句

0条评论

登录后参与评论

上一篇：更改DESFire主密钥时出现0x1E错误（INTEGRITY_ERROR），我有什么错误？该如何解决？

来自分类Dev

如何使用正则表达式从特定格式的字符串中提取键值对？

来自分类Dev

如何在Excel中提取遵循特定格式的文本字符串

来自分类Dev

从字符串、正则表达式、python 中提取特定格式

来自分类Dev

按照特定格式从完整地址字符串中提取城市和州

来自分类Dev

检测特定格式的子字符串

来自分类Dev

检测特定格式的子字符串

来自分类Dev

解析特定格式的字符串

来自分类Dev

如何从字符串中获取特定格式的所有子字符串

来自分类Dev

如何使用字符串公式以指定格式提取Excel中的字符串？

来自分类Dev

验证特定格式，而不使用“-”分割字符串

来自分类Dev

从字符串中提取特定字符

来自分类Dev

使用开始字符串和结束字符串从长字符串中提取子字符串？

来自分类Dev

使用开始字符串和结束字符串从长字符串中提取子字符串？

来自分类Dev

从字符串中提取子字符串，python

来自分类Dev

Swift：从字符串中提取子字符串

来自分类Dev

从字符串的“列表”中提取子字符串

来自分类Dev

Excel从字符串中提取子字符串

来自分类Dev

php：从字符串中提取子字符串

来自分类Dev

从字符串中提取子字符串

来自分类Dev

Android Java：在特定字符后从uri字符串中提取子字符串

来自分类Dev

从文件名中提取特定的子字符串

来自分类Dev

如何从特定字符串到特定结尾的字符串中提取子字符串？

来自分类Dev

从R中的格式字符串中提取数字

来自分类Dev

从R中的格式字符串中提取数字

来自分类Dev

在MySQL中提取子字符串

来自分类Dev

在python中提取子字符串

来自分类Dev

从文件中提取子字符串

来自分类Dev

使用Java从格式化的字符串中提取

来自分类Dev

如何从python中的字符串中提取特定的子字符串

Related 相关文章

文章