c#winform 多标签正则采集




   private void button1_Click_1(object sender, EventArgs e)

        {

            WebRequest req = WebRequest.Create("http://bbs.gxhc365.com/forum.php?mod=forumdisplay&fid=55&filter=lastpost&orderby=lastpost");  //URL
            WebResponse result = req.GetResponse();
            StreamReader sr = new StreamReader(result.GetResponseStream(), System.Text.Encoding.GetEncoding("gbk"));   //设置编码
            string content = sr.ReadToEnd();
            richTextBox1.Text = content;


            List pianduanList = new List();  //存放提取的片段
            string startString = "CONTENT_TID=";  //开始标记
            string endString = "";                   //结尾标记


            int startPos = -1;  //查找开始位置
            int endPos = -1;    //查找结束位置 
            do
            {
                startPos = content.IndexOf(startString, startPos + 1);  //查找开始标记的位置,从后一个开始查找 
                endPos = content.IndexOf(endString, endPos + 1);   //在结束标记的位置,从后一个开始查找 
                if (startPos != -1 && endPos != -1)  //找到的情况都不为 -1 
                {
                    pianduanList.Add(content.Substring(startPos, endPos - startPos));
                }

            } while (startPos != -1 && endPos != -1);   //循环查找,直到全部找完为止

            //循环从提取到的片段里提取 标题 链接和时间
            for (int i = 0; i < pianduanList.Count; i++)
            {

                string 标题 = Regex.Match(pianduanList[i], this.textBox1.Text).ToString();
                if (标题 == "")
                {
                    标题 = "没有发现标题";
                }

                string 链接 = Regex.Match(pianduanList[i], this.textBox3.Text).ToString();
                if (链接 == "")
                {
                    链接 = "没有发现链接";
                }

                string 时间 = Regex.Match(pianduanList[i], this.textBox5.Text).ToString();
                if (时间 == "")
                {
                    时间 = "没有发现链接";
                }
                richTextBox2.Text += 标题 + " " + 链接 + " " + 时间 + " " + "\r\n";

            }



        }
    }
}

winform代码