如何在python的表中分隔每个tr?

阿维纳什

我正在尝试从http://www.livescore.co.uk/worldcup/tables/解析表我在管理输出时遇到麻烦。我只想在输出中显示文本,也想休息一下显示了所有td之后的每个tr。我是初学者,我正在尝试学习。因此,有人可以建议我做错了吗?有任何建议吗?

from BeautifulSoup import BeautifulSoup
import urllib2

pageSource=urllib2.urlopen('http://www.livescore.com/worldcup/tables/').read()

soup = BeautifulSoup(pageSource)
alltables = soup.findAll( "table", {"class":"league-wc table bh"} )
results=[]
for table in alltables:
    rows = table.findAll('tr')
    lines=[]
    for tr in rows[1:]:
        cols = tr.findAll('td')
        for td in cols:

            text=td.renderContents().strip('\n')

            lines.append(text)




    text_table='\n'.join(lines) 
    print text_table

输出:

<a href="/worldcup/team-brazil/">Brazil</a> 
0
0
0
0
0
0
0
0
1
 <a href="/worldcup/team-cameroon/">Cameroon</a> 
0
0
0
0
0
0
0
0
1
 <a href="/worldcup/team-croatia/">Croatia</a> 
0
0
0
0
0
0
0
0
1
 <a href="/worldcup/team-mexico/">Mexico</a> 
0
0
0
0
0
0
0
0
 ....similar

我的愿望输出:

1,brazil,0,0,0,0,0,0,0,0,0,0
2,cameroon,0,0,0,0,0,0,0,0,0,0
3,craotia,0,0,0,0,0,0,0,0,0,0
4,Meico,0,0,0,0,0,0,0,0,0,0
米滕克

干得好:

from BeautifulSoup import BeautifulSoup
import urllib2

pageSource=urllib2.urlopen('http://www.livescore.com/worldcup/tables/').read()

soup = BeautifulSoup(pageSource)
alltables = soup.findAll( "table", {"class":"league-wc table bh"} )

results=[]
for table in alltables:
    rows = table.findAll('tr')
    _table = []
    for tr in rows[1:]:
        _row = []
        cols = tr.findAll('td')
        for td in cols:
            if td.findAll('a'):
                text=td.a.renderContents().strip()
            else:
                text=td.renderContents().strip()
            _row.append(text)
        _table.append(_row)
    results.append(_table)


# print results
index = 1
for table in results:
    for row in table:
        print ','.join([str(index)] + row[1:])
        index += 1

输出:

1,Brazil,0,0,0,0,0,0,0,0
2,Cameroon,0,0,0,0,0,0,0,0
3,Croatia,0,0,0,0,0,0,0,0
4,Mexico,0,0,0,0,0,0,0,0
5,Australia,0,0,0,0,0,0,0,0
6,Chile,0,0,0,0,0,0,0,0
...

这个想法是先收集原始数据,然后编写逻辑以显示数据(以任何方式)。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何在min()谓词序言中分隔值

来自分类Dev

您如何在Spring Boot中分隔角色?(Web与Scheduler等)。

来自分类Dev

如何在C#中分隔名字和姓氏?

来自分类Dev

如何在R中给定文本中分隔单词?

来自分类Dev

如何在SQLite中分割逗号分隔的值?

来自分类Dev

如何在php中分隔日期和时间?

来自分类Dev

如何在Swift中分隔NSDate()的日期和时间组件?

来自分类Dev

如何在javafx中分隔我的GUI?

来自分类Dev

如何在JFrame中分隔面板以分隔类

来自分类Dev

如何在熊猫中分隔列名称及其值?

来自分类Dev

如何在Google图表的区域图中分隔日期

来自分类Dev

如何在python中分别计算每个群集的轮廓分数

来自分类Dev

如何在R的列中分隔2个数字

来自分类Dev

如何在参数中分隔单词(discord.js)

来自分类Dev

如何在字符串中分隔SQL变量

来自分类Dev

如何在min()谓词序言中分隔值

来自分类Dev

如何在Python中分割重复的分隔符

来自分类Dev

scrapy,如何在HTML标记元素中分隔文本

来自分类Dev

如何在页面中分隔两种形式

来自分类Dev

如何在python中的列表中分隔字符串?

来自分类Dev

如何在PHP中分隔电子邮件和数字

来自分类Dev

如何在Android中分隔特殊字符串

来自分类Dev

如何在oracle中分割逗号分隔的字段?

来自分类Dev

如何在Django中分隔登录重定向网址

来自分类Dev

如何在Python中基于第一列的值从csv文件中分隔行

来自分类Dev

如何在git分支中分隔文件

来自分类Dev

如何在php中分隔项目列表?

来自分类Dev

基于字符,如何在新行中分隔熊猫数据帧的每个单元格?

来自分类Dev

如何在 for 中分隔 RadioList?

Related 相关文章

热门标签

归档