控件WebBrowser获取含框架的网页的完整HTML代码

  • A+
所属分类:编程茶楼

 

(WebBrowser1.Document as IHtmlDocument2).body.outerHtml;

我以前也是这么用的,这种方法的美中不足就是只能获取网页<body>与</body>之间的网页源码,而<body>之外如<head>部分的网页源码就获取不到了,本人在网上搜了很久,终于找到解决方法。好的东西不敢独享,现将这种方法共享出来:

procedure TForm1.Button1Click(Sender: TObject);
var
  ole_index, oleObj: OleVariant;
  i: integer;
begin
  if WebBrowser1.Busy then Exit;  //网页加载中,退出。
  Memo1.Lines.Clear;
  //获取主框架网址及网页源码
  Memo1.Lines.Add(WebBrowser1.OleObject.document.url);
  Memo1.Lines.Add(WebBrowser1.OleObject.document.documentElement.outerHTML);
  Memo1.Lines.Add(' '); Memo1.Lines.Add(' '); //添加空行
  //循环获取每一个子框架网址及网页源码
  for i := 0 to WebBrowser1.OleObject.document.frames.length - 1 do
  begin
    ole_index := i;
    oleObj := WebBrowser1.OleObject.document.frames.item(ole_index);
    Memo1.Lines.Add(oleObj.document.url);
    Memo1.Lines.Add(oleObj.document.documentElement.outerHtml);
    Memo1.Lines.Add(' '); Memo1.Lines.Add(' '); //添加空行
  end;
end;

  • 我的微信
  • 这是我的微信扫一扫
  • weinxin
  • 我的微信公众号
  • 我的微信公众号扫一扫
  • weinxin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: