Nhờ các bạn một đoạn code về RegEx

pokervn2012

Hero
Verified
Joined
Jun 27, 2012
Messages
2,091
Reactions
1,941
MR
0.584
Follow me on Facebook Chat with me via Skype
Mình đang viết một cái tool nhỏ phục vụ công việc, bị vướng cái đoạn code RegEx bác nào biết về RegEx vào xem hộ ( code C#)

Giả sử mình có đoạn data như này

abcccc1111 <br> <td>....
<span class="lop1">Bui Van C</span>
abcccc1122 <br> <td>....
abcccc1133 <br> <td>....
<span class="lop1">Nguyen Van A</span>
<br><td>444bbbcccddd.....
<br><td>333bbbcccddd.....
<a href="link1">Link1</a>
<span class="lop1">Tran Van B</span>
<br><td>bbbcccddd.....
<br><td>bbbcccddd.....
<a href="link2">Link2</a>
<br><td>111bbbcccddd.....
<br><td>222bbbcccddd.....

Mình muốn lấy được những thằng thuộc class="lop1" có href link. Nghĩa là sau khi chạy code thì sẽ ra

Nguyen Van A - Link1
Tran Van B - Link2

(còn thằng Bui Van C không có href link thì không lấy)
 

vikowelic

Banned
Joined
Oct 27, 2014
Messages
595
Reactions
446
MR
0.000
Call me! Call me! Chat with me via Skype
Mình đang viết một cái tool nhỏ phục vụ công việc, bị vướng cái đoạn code RegEx bác nào biết về RegEx vào xem hộ ( code C#)

Giả sử mình có đoạn data như này



Mình muốn lấy được những thằng thuộc class="lop1" có href link. Nghĩa là sau khi chạy code thì sẽ ra

Nguyen Van A - Link1
Tran Van B - Link2

(còn thằng Bui Van C không có href link thì không lấy)

Xử lý html thì nên xài HtmlAgilityPack, đoạn code sẽ như vậy

HtmlAgilityPack.HtmlDocument hd = new HtmlAgilityPack.HtmlDocument();
hd.LoadHtml("du lieu can xu ly");

foreach(var item in hd.DocumentNode.SelectNodes("//span[@class='lop1']//a[@href]"))
{
string name = item.ParentNode.InnerText;
string link = item.Attributes["href"].Value;
}
 
Xử lý html thì nên xài HtmlAgilityPack, đoạn code sẽ như vậy

HtmlAgilityPack.HtmlDocument hd = new HtmlAgilityPack.HtmlDocument();
hd.LoadHtml("du lieu can xu ly");

foreach(var item in hd.DocumentNode.SelectNodes("//span[@class='lop1']//a[@href]"))
{
string name = item.ParentNode.InnerText;
string link = item.Attributes["href"].Value;
}

Cậu chuyển sang RegEx hộ mình được không. Code có sẵn rồi mình chỉ phải thay đoạn RegEx thôi
 

Announcements

Today's birthdays

Forum statistics

Threads
427,430
Messages
7,208,916
Members
179,714
Latest member
Dongphuong2005
Back
Top Bottom