如何从python列表中删除非单词

debugcn 发表于 Dev

用户名

我正在列表上运行一个包含字典查找的函数，因此我需要删除所有非字典性单词，因为如果不这样做，则会遇到关键错误。我不能只使用“ continue”，因为我没有循环执行此操作。我认为我没有太多，所以如果需要的话，我可以一一做到（尽管我不想这么做）。列表中的对象都是unicode，这使得删除它们变得更加困难。

我的清单如下所示：

my_list:
[[u'stuff',
  u'going',
  u'moment',
  u'mj',
  u've',
  u'started',
  u'listening',
  u'music'

等等...

或者，如果我这样称呼它，我将得到一个括号：

my_list[0]:
[u'stuff',
 u'going',
 u'moment',
 u'mj',
 u've',
 u'started',
 u'listening',
 u'music',

等等...

我已经尝试过类似的事情：

my_list.remove("mj")

和

my_list.remove("u'mj'")

和

my_list.remove[0,3]

有任何想法吗？谢谢

编辑：回应凯文：这是我如何以这种方式获取数据

my_list = []
for review in train["review"]:
    my_list.append(review_to_wordlist(review, remove_stopwords=True))

函数在这里：

def review_to_wordlist(review, remove_stopwords=False):
    #remove html
    review_text = BeautifulSoup(review).get_text()

#remove non-letters
#possibly update this later to include numbers?
review_text = re.sub("[^a-zA-Z]"," ", review_text)

#convert words to lower case and split
words = review_text.lower().split()

if remove_stopwords:
    stops = set(stopwords.words("english"))
    words = [w for w in words if not w in stops]

return(words)

安迪

你近了。问题不在于unicode，而是您remove在外部列表上进行调用。由于您的文本列表是列表内的列表，因此需要从中删除。

改为执行以下操作：

my_list[0].remove('mj')

您还可以将其前缀为unicode字符串（在这种情况下，结果相同）：

my_list[0].remove(u'mj')

例子：

my_list = [[u'stuff',
  u'going',
  u'moment',
  u'mj',
  u've',
  u'started',
  u'listening',
  u'music'
  ]]
my_list[0].remove('mj')

print my_list

输出：

[[u'stuff', u'going', u'moment', u've', u'started', u'listening', u'music']]

请注意，该字符串mj已删除。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-10

我来说两句

0条评论

登录后参与评论

来自分类Dev

如何从python中的列表中删除单词

来自分类Dev

如何从python的列表中删除重复的单词

来自分类Dev

如何从列表中删除非ASCII字符

来自分类Dev

从列表python中删除非数值

来自分类Dev

从python列表中删除单词？

来自分类Dev

如何从变量或列表python中删除某些单词

来自分类Dev

如何从段落中删除单词列表？

来自分类Dev

python：删除列表中包含单词的行

来自分类Dev

如何有效地从 Scala 中的字符串中删除非单词字符？

来自分类Dev

从复数列表中删除非共轭

来自分类Dev

如何在不使用集合的情况下从python列表中删除重复的单词？

来自分类Dev

如何在不使用集合的情况下从python列表中删除重复的单词？

来自分类Dev

如何从R的一列中的列表中删除单词

来自分类Dev

如何从 Flutter 中的列表中删除选中的单词

来自分类Dev

python如何计算列表元素中的单词

来自分类Dev

python，从列表中删除字符串中的单词

来自分类Dev

从python中的列表中删除自定义单词

来自分类Dev

从嵌套列表中删除python中的小单词

来自分类Dev

如何使用Java删除非单词字符的行？

来自分类Dev

如何同时检查和删除单词列表中的“ /”和“-”

来自分类Dev

如何从字符串列表中删除单词？

来自分类Dev

python在xml中删除非标签

来自分类Dev

在Python脚本中删除非选择文本

来自分类Dev

使用列表理解从列表中删除单词

来自分类Dev

如果单词在Python的两列中都从两列中删除列表中的单词

来自分类Dev

如果单词在Python的两列中都从两列中删除列表中的单词

来自分类Dev

如何从 Python 中的列表中删除引号？

来自分类Dev

如何从python中的列表中删除引号？

来自分类Dev

如何从python中的字符串中删除整个单词？

Related 相关文章

文章