仅当存在匹配项时才返回true，但不是第一个匹配项

debugcn 发表于 Dev

发声的

我想我已经在标题中写了我想做的事情，所以到现在为止：

我有一个带有url链接的.txt文件，其源代码将通过正则表达式进行解析。

每个链接的源代码都是通过以下方式抓取的：

public static string getSourceCode(string url)
{
    HttpWebRequest req = (HttpWebRequest)WebRequest.Create(url);
    HttpWebResponse resp = (HttpWebResponse)req.GetResponse();
    StreamReader sr = new StreamReader(resp.GetResponseStream());
    string sourceCode = sr.ReadToEnd();
    sr.Close();
    resp.Close();
    return sourceCode;
}

每个源代码都包含以下文本：

..code..
..code..
    <p class="content">

                                exampleexampleexample

                                        </p>
..code..
..code..
    <p class="content">

                                example

                                        </p>
..code..
..code..

元素的content元素更多。

我得到的content内容是这样的：

Regex k = new Regex(@"<p class=""question-content"">[\r\n\s]*(\S.*)"); var g = k.Matches(sourceCode);

现在，我可以轻松提取每个匹配项：

g[1].ToString() <-- first match
g[2].ToString() <-- second match
g[3].ToString() <-- thirdmatch

等等。

但是我想做的是在以下位置提取这些链接：第一个匹配项不包含XYZ，但XYZ至少存在其他匹配项。

例如：

第一个链接的源代码包含XYZ第一个和第三个匹配<-错误

第二个链接的源代码XYZ仅包含第一个匹配<-错误

第三个链接的源代码XYZ仅包含第三个匹配项<-成功！

解决方案

我从这里得到了每场比赛的成功：

MatchCollection b1 = Regex.Matches(sourceCode, @"<p class=""content"">[\r\n\s]*(\S.*)");

我接下来要做的是通过以下方法检查第一个匹配项是否不包含“ example”：

if (!b1[0].ToString().Contains("example"))

并检查此功能的结果：

bool checkAnother(int amount, MatchCollection m)
{     
    for (int i=1; i<=amount-1; i++)
    {
        if (m[i].ToString().Contains("example"))
            return true;
    }
    return false;
}

这就是代码：

            MatchCollection b1 = Regex.Matches(sourceCode, @"<p class=""content"">[\r\n\s]*(\S.*)");

            if ((!b1[0].ToString().Contains("example")) && (checkAnother(b1.Count, b1)))
            {dataGridView1.Rows[i].Cells[2].Value = "GOOD";                   
            }

晚安书呆子骄傲

您尝试执行的操作不适用于正则表达式。

多行匹配，捕获组和环视可能是可能的，但是IMO花费大量精力到无法维护的解决方案中是不值得的。

尝试在后处理步骤中验证找到的匹配项。假设您像这样抓住比赛：

var g = k.Matches(sourceCode);

...您可以轻松实现以下目标：

var isFirstOk = !g[0].Value.Contains("XYZ");
var areAllOk = isFirstOk && g.Cast<Match>().Skip(1).Any(m => m.Value.Contains("XYZ"));

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-26

我来说两句

0条评论

登录后参与评论

来自分类Dev

HtmlAgilityPack仅返回第一个匹配项

来自分类Dev

PyQuery-attr match仅返回第一个匹配项，而不是所有匹配项

来自分类Dev

仅子查询第一个匹配项

来自分类Dev

仅删除sed的第一个匹配项

来自分类Dev

NSPredicate仅查找第一个匹配项

来自分类Dev

仅打印第一个匹配项

来自分类Dev

preg_match仅返回第一个匹配项

来自分类Dev

正则表达式仅返回第一个匹配项

来自分类Dev

Ruby str.match（regex）返回仅包含第一个匹配项的MatchData

来自分类Dev

Python re.findall仅返回第一个匹配项

来自分类Dev

合并熊猫数据框时如何仅使用第一个匹配项？

来自分类Dev

仅匹配正则表达式行中的第一个匹配项

来自分类Dev

AWK仅匹配多行文本中的行的第一个匹配项

来自分类Dev

使用“ sed”仅替换第一个和最后一个匹配项

来自分类Dev

C＃中的正则表达式仅返回第一个匹配项

来自分类Dev

C＃中的正则表达式仅返回第一个匹配项

来自分类Dev

别名选择器不起作用的SQL IN运算符仅返回第一个匹配项

来自分类Dev

正则表达式仅替换每个匹配项的第一个匹配项

来自分类Dev

sed更改另一个匹配项的第一个匹配项

来自分类Dev

在具有多个可能匹配项的BASH中使用cp时，如何仅复制第一个匹配项？

来自分类Dev

XSLT选择第一个匹配项

来自分类Dev

提取符合sed的第一个匹配项

来自分类Dev

正则表达式PHP仅获得第一个匹配项

来自分类Dev

如何仅使用.Net Regex.Replace替换第一个匹配项

来自分类Dev

C＃RegEx-仅获得字符串中的第一个匹配项

来自分类Dev

将mysql查询的结果限制为仅第一个匹配项

来自分类Dev

Javascript正则表达式仅替换第一个匹配项

来自分类Dev

正则表达式仅捕获第一个匹配项

来自分类Dev

使用grep仅获取每个文件中的第一个匹配项

Related 相关文章

文章