From 283dae295c3d99f0b35b94cb304be23a0f450866 Mon Sep 17 00:00:00 2001
From: Benedikt Willi <benedikt.willi@unibas.ch>
Date: Fri, 9 Jan 2026 14:11:46 +0100
Subject: [PATCH] Implement HTTP redirect following

- Support for 301, 302, 303, 307, 308 redirects
- Automatic Location header following
- Relative URL resolution for redirects
- Max redirect limit (default 10) to prevent infinite loops
- 303 (See Other) automatically changes method to GET
- 4 new unit tests for redirect functionality
- All 73 tests passing
---
 .../__pycache__/chrome.cpython-313.pyc        | Bin 12114 -> 14841 bytes
 src/browser/__pycache__/tab.cpython-313.pyc   | Bin 4382 -> 5410 bytes
 src/browser/chrome.py                         |  87 +++++++-
 src/browser/tab.py                            |  26 ++-
 src/network/http.py                           |  95 ++++++--
 src/parser/html.py                            |  35 +++
 tests/test_frame.py                           |  76 +++++++
 tests/test_html_parsing.py                    |  82 +++++++
 tests/test_http.py                            | 204 ++++++++++++++++++
 9 files changed, 580 insertions(+), 25 deletions(-)
 create mode 100644 tests/test_frame.py
 create mode 100644 tests/test_html_parsing.py
 create mode 100644 tests/test_http.py
diff --git a/src/browser/__pycache__/chrome.cpython-313.pyc b/src/browser/__pycache__/chrome.cpython-313.pyc
index 00bccf241968e01dc7e8c2366a3f8af91a47cc3b..1e9e281a30c162c882408318e4278ec6c655a2d4 100644
GIT binary patch
delta 3040
zcma)8U2qfE6}~I)%KBM(SJuC<V8OOz*+>Rr^OLkSp>c;8Ovx^raR*W(%WGR1d*!*3
z`D+@%L#HAs1LlU>B(!#)3e$E<lNb6>LZ<07FP)&;t<)W6>Nc5n$V*6|NjsCy^xTz%
z4SDGu>D+tnJ@?$BbG~zq{`l?x<eKigTn+@|d;dL}dAIFXO?Jj%r96!Lx5-9k?rTTH
z9*fcxMlZ71t+-51Fu7($JR&OYBOaysh^NP@c+6d|;teD0Q+(Jz?vDrFdYAdlCd(HM
zgptCeufs>)Y<rtkk?bb!*gCgWwRTh=Ln#kJDk5UY+cNb0P){#g-Ivfee{i_AMo9LO
zgN_!f-l#Up0rGT*M`-9}>VmKrBJZ?ENHpppM}toCMZ1G(A-94)(h_wr>&ZLOq^PjH
zmg)uFrgCyCRnp8UtYRJdelPb>6`5uI<l}W7@_x+D*;Tt71AD_3IZn+EIh01lw$C@<
z*PRkNoUGmg>$Z@sl83l$9`aGh(V_DyFZb3DS7+6+#%5mLK{Z<?1j4(hc9-k$lXYSF
zE3*f^-k}7%*SP8t)gt%NOC;8j5Y{LgcgA^=?ih?paDPwscuvF8-%r0L_3L?9r6g6}
zFXgk+2&PAOw~@bg#2AS*#``+l!{b_hIGqJSJwKe+PUH>mFxK=@4Vzs3i1f$LFz3kc
z;~LXM5}lo*!LPl9uaR$ct_z=o=MC#*HU-xW>vZPC$jn%-2{t8iuCrLUXGOu5av)I(
zB$fi*MgAYozzQ#x`SuduzBqQH|4;nD11s`{<_0bfkp0E}3hyrS>r4Fl`TR292Hg1r
zXAfNIS?Igmx6F6l@dV~}UEFo$(83FsUnobmmm=GjB0FzvTJn6g_)LXwF7uHRAGy7L
z_pMF0M&4^%=9%ZorLG0ZuwpGggY|R`KVTk04Ylw6Wn=>ObH+=K@HUbRTFG;*enR;_
zNM2TFREGRbdU!|?Z70*57dBf8Z76OzwWa?=9;ecIiF#A2c}W_>*(nKjGsiS3pBjnf
zq|t18W(vHX#NUC(;~W-X!qY$u$5bk#50By0lxEoKa)xUd6jIG*Wa1VaqOzPRmZR7%
zND>ZHC70+y@aq%srk4CtgntXCxxGM6qZPq({-v`om4zsLDjwg8=$+$d`LY-*iLtV{
ztt4(MauvaQ{^j#8!!ZO<^p=H<C1K-Y`%jZUNiGRnZ`-!w2q;Ti&_0-IgO(EN)BFDh
zatSGnV%diV7~L{p(HkIj8f$WBsJWh&59<LB^?)HvyBGYqM$q#m!EYecjdWIJWV4dh
zRaR#Y+S`hd&Z(^Idh~>H5H{-W$A-$)6V#jwa4ez0c7&WTD-E*yF?nEBwtl4zjk9s?
zREMmkXK)VUJb6;81*{4M69Rh=4MHwrO-tUTA&XlK_7F%Jjs24vMT5aeRXo@YXJI;p
zA(fL8`Kd{K6QuFmKnzDFm(g?il%CcM)=XJjdLlD93Tca<rBc79QtXS_j2^dELBi@;
zNXb<d9KDvq!yuTWp_0r|1&?{#OTkm1=vj-o_o@6*Ag9qkZQUO_eHTW{&W$DK#tO~F
z*<H8!mOHM%JX>}}ORi|e>xUc;MHV7gA{V%d=%dh@KU9u%mm=NQxuwYVKZ`p)X+YuF
zipM{<b9U!^Kk2*8Z>k7x6Hz!yk&1st$<KkLYgHPS2-)Ck0_;r-xy!UQ)ypjeoRc}T
zLooHoNC@^Cp+k7cnP7V}gwmp051VQzksW5M*uXg$p4M?jpfy%ht#!ab*RfRlR;vvF
zXNRvtY0#Z&gTf{NdQk6e0JjlXxztA5$$C_m!X-d=-2}a9=qBY={>j%6N<rsP9S;E?
z1I{k{sL=&Z4p5sO9jlF_t`B~atDDgsYLo699HiQ0-=lXZr@B_<;eE&hkRGkVdCmJ$
z^?iDS^mhpVzYU627gVd#n1IOWqG|^xL}BF~dZ5^-W6a+QFqhD{9kP_xtH*}wR%}C`
zL*A`+V4<Ljrm4apc!*}+xIOMTm5|M@^k`K*p2<&0BdJ^_EgjF|QRz5NO;2a^@#G;)
zO9G}Tc9;4Y-=eGaK*q<+@mU{!6}SU&7rp>9o}*-*lFKyh@#~blLCF<Legwqea?_KU
zyy2YEQn?wd(Y&oD-0!H!kAcLS&3wbZpc{{(7hj_)>|@YshjW=z8vZ5aIcj#!;3hM=
zmV=%;gRxcs3CbHTlLhX0W;8!x*r!q_YD<=0GaQuGc9@fflU^F0&@$r_d4n}IHp3g$
z++ItodHzHC{<?aTSkv?U^`?IZBy!srn(iNpUJ~w#ax0M2cCx!GP{=F^yNfJz1h;R_
zG3y{aGzzg9NFY??E5T6FRq=-A_sk9y?H_nU(2+xtawuL3#jmzq_gw2-3iTETR)m(4
z5Wo8DlF)l|bG<+)3qzNO7AKb?Pb`Z)6{&6h*af~KbzXF>h%IHYwIsGKKC>)N#w%i^
zBz9eNed0mB@MnI+2kAeA{b%>jdlrJ1gNvJ&Lfy;!7O>DI6q$;D!(!`fw&<)HBZy$y
zQ?C~OBKjWwRhS=L+;f$=?px+}RCw2gbtS&#m8U<ogLZO8^ppP0Z+Xoa@-?4LLzB+4
z4B-<QCP0oQaQM66FthnqOK=06W9nx3dvrI^%e+E1B%j+E<Kp*Z#=&h{eBuFu>0Z#u
zH7_a;5KQ;NQ7&@ba}U9ELouiKS|3pEUkAxdGV3(4YNskcARi}#%tyr5{giOBf$91b
JQEC>>{{jB(=KlZy

delta 710
zcmYLF-%ry}6u!5trCqm{xnj1#u>2})Ai80Jq0s~%Btw$9rGg<CA*;A#tfUNa`XG<Q
z2Mit)H8HZsy#WD}8DpIO1w%+s<VAhr%?O$p6JyI<I1k@F_dDPD&bjyZ^oQ%*zTIv`
zMywv(NUYSXatyW-=G}<>7f_F%*gQzDigCJQg7;Oe{lae=h}{a9Yv_P)O$GSV#DdB=
zAsk>~+2ev9$%ZM&k^<aoW+7u#iY^-NOLpv9j0kW|s)Kb#c;ukrv&52>3K=~C*z1J9
z62;$^$<kmEmHFCArGi5-La}hD(-O19=;0$3oNjhOL8_rrv_eN4;hp4x=9W5FjEPwX
zoM9nl714;lWQkC;9dNx9UR4SKR>mbZ#VTwxP*xnB3R6}XtFX~d)0#R=Wiw?{wvn#?
zYWQNU78=lSyD^oKEhW~F5>T)nzBAK$lD8e%P1t=Lylfpj<uRmv+U&Hdi(ls+i-Un)
zv0qIlHE~GOlkvTvQNBwLB~o#1wpZMXK&!6>*FnU00rI{%yZ|A;itVuE_Y-;!KKX0h
z3r5EdmDI-Ks=h-_CGL#R+?=)>Byer><N<{o)i5ec$}aDGn0b(SE-ZPUdAHrc4R>(U
zeP(5RlMl^XKGNJa?cSi>MNe0r$oCa2TlD4c6k_-i{j@);WH03cxvRPUqDNlQ^TB+2
ziynaE?MvXSazM6gO~{#>*e>4EwMn&OYAlgTzeO<7oxsOnqg%&0810eq5J1lrvXS)t
u3`1>5Yg#m#bjF0&CU{LS|7eFkH>t&ElInT=JuHXL@@WFM{Xixjiv9s3*|@#{

diff --git a/src/browser/__pycache__/tab.cpython-313.pyc b/src/browser/__pycache__/tab.cpython-313.pyc
index d86817a1746ac49550b81897fddeeeb8c3c7ff21..ee990ac54d6ae62f9bb4f99976d2debf30b9da15 100644
GIT binary patch
delta 2382
zcmahKTWk|YaMyP}pY6+o1o9$*3*~hVNq|6r)F1*Rg#advV}y!SbFnW@gmY*1&Vrb>
zMy*suDwPsl5%dQE>IYPn8ia)U2~|Jx85%006>a(G4}VbFf?8GT&K?fXhq}_u&dlz-
zXXh@ixDqLUQdSm1Y<=+OvC*_LRbGd)Q){%naWO9Km-+%Epdy9`_RD=i66_0+kc#Ti
z3KW+cP&~NV2cig(Fz1CBFTB80GJ>W|y|Zh%hN(E>I62KnLphz;Msma%%hEtk))+HP
z$Gt4nOx-<z!)`Nfz@2UsYfIuNfwF?99H9)lhGUxOX7P$;R8Cu|JjiJx6>TFsOv=H7
z3ILVv6+Bo}7-}~#a0bm+*PNB-8`s{I>*t#ycjbopmi7tp<FY606j32hm>W5LJZtIc
z)Pgy76ks3FPbM%z=g=~Alo8$<cph_!hJ6J(QdNpOUu1&0O{PB~#BtXVg!ByvCHw>a
zmjygL?u!d?ahuPSj)FnH64GX75*EvV=wS#QsT|-{D$(Aal}dC*i8FiUC@v*%k!^tv
zzZrN*Y2e?KW|U@h6q3hR0O|V?GUd3Okhuoo|1}(~EJ+Vkl`vFXz*w6EONIxQEU*`l
zcqoCHsW2Gq5KA{zv>e41Q|^{oRD2)C!)Uv(91UZwtf2N9PHIHe&9us!Np(gHH8F5N
zO<AVH+M=!aaE4hZ`18(i>sA^dMlP$T4Az8_L5M}{LRA#{Z%1^<N{{d80iIe|)TQ?7
zqgf-ZI+hCUpccxb?fgcxonJ33eOWAKI43P~T;<|jY9TaaowN<o=IBGkLdD-z`MT7Y
z7A8<GaOgzdupKI;jg*x(2$Y^I0syt3;Z&Xw7Dp1AGuU$~W#pVu%cOy<mC1~n85+zO
z&H;uSg!*|zT982YNiBdn$Ul{AM|bizRh}m$>5S(LDndL|bc|CD4RKNLC1S%4GFi2>
zNHsVjLK<kOm*`_g8{lBX{)T}w=#f|*?8o=D)-M}BZ=6oeX}j+zt0#Idt$a|iq<EqF
zqjw+FE<JyG>hz^8)7vIb&(?0A6n~LWbIa9DbL#p@@sqOoHIei3l>A-g%107XH%_mf
zuAAM~H`6h*YUaJ!rne_U_tnVNt~s@HQao4o?5B#lCrD%#A1v*hJ~5s8YT0c4-if~Z
zjjJye<{CFn>^XbzzEXWpY5G=ax=_r{DJ}Pu4R@3c(}!;DzO{MAH?v{pwb_lad&;3Z
z%Ar3V1wqyC_Hq`=``s1Y>(K40dVuRfyRmS)vm5V<3SUS4jL<}{GSKJVh=CeuzF182
zdF2uY^&wIQ%n+56NmCzlfAzK3E(QU3@&v{R^$(3ZhD{>w>q1js4X`1_1l}|UVTRai
z82AwV<`ezvA1h1z{rH0L2*G}7<ZAx1^_1fthj1Ms_o8rBTF1m5M%)A97nPl$Zz}+Z
zjf7m;A8F^kv2bF8KdjK61K=iASO{&&<fu97B$F+!?%$$-`q=Y^y78I+CQfgMn?lww
zNfa<i&*cm=O+YUdldLyMGe`HudJmD;8A>7yXu>P4$%1^vJY1nNn1}xAaBl`a#Wgqj
z<t{w9lN}Yp>`2X6$ss*;e6UxO33$OB;D*U=Ah})to}OKaH(nUN=6hk-hKUUkyFUc$
zanyYlG;xi4U8%ouCbSddo$l>$oxwGC|A%_A7Y-JpBKsJ*pq1e?#GD+q$Vr`~X*tC6
zg6@I44g>6O<lYW6x^F3mS&-M2ejGW-*#A@}5yN|Wpvc2xZc8~~PG2l{+Mu*lupOdd
z9-|Ha3$LEk?~FQGg9bs8qlev{6)i<5rzUwh<DCID^peSgf|k+n!?nQWy<A0F0dE7)
z4q!b4R2VfK@@i)j_H*+}4b#QSl0Kkg0Nw-<IY+Eqt3jM`G6>8BfQ<k;0Dxm&Cqfq!
z01>yg(%~L+QY)i@WRm^!lSwMEDaIxse^OrA!=^Wf+t{$=&y5D2bG%_2=D!Hi1{2&H
zv@+P??~Yr1)e9;|$E<WdYbZO&F?JC$Yqz?OD;GC^j~aeNtxu&!+>ak4fKPX<$E$uu
I4Dc}i0wUQQ8~^|S

delta 1296
zcmZuwOKTHR6uvi;W+u<ZBz@R6Hnu)GsirDOeHQUi5i|;|prDLtGsfUF6VFU23Q|{s
zph&q0x)F6{z>QSh_$vg(I&R#!(1p}zx1MvSwG<qf@7{CHz2|)Aai8QL_9cGC;}M46
z^IsRLueI4kCqFg2S>Mvh`q)^gi;bx}17v0lLQ<!pF8oiYRunxld;g%QtL>tdALn6l
zj(70^G0k<g!kWCOE8->Z%jiKb=$O_;h?1)qL0tUi<2@AINh91~^Xc~6+I-KzTW#%p
zHvdlR5>_C$hQcfO|J;CZkDW=1Q?bm9#Zi)9g#r1{1Jbn@oooP@HP>i>)l?vXCLs5a
zL2$@XE|-H=T)m)Wm&#sb6iQQOf%c?zh}#YJskiU0c1wGw^*{<0x&m=reBziw8sim<
z%Q2Pl(gZ}ri_l)46bqrYawnek+6=>SOKx@2D7h|FCmOEl7)FyxhmrxP<dYzbztfL!
zll=)OErZ`9ftLRJ$^ygX(WR%2$Mzy^rR?8V#gzIK8^qX`jOf;$C8<2HiJ+Z874NnD
zkWBxdWmWo+#A99zsTT~RTC2K-(I&Qqhhvm)aj9l=PWTl+H%KQH%dA13cA-+eZq~{`
ze!ZY!*%ePks8nkeFL<mtdJ=TB02Ki`5LSnkwb3Xnl{_o%L?7_f+~(LGK2yNM*P>|3
zRcvFTG<kV^RM&u_%fK=qY$tICg4c5R$idS`SAsPIEA4h@Y?d3XF1ho_cVS7OQaL69
z4qmkNeKh+<e2Sk(DkF)rd`wbFEK#{=!*mJC<D<>6&t?d({f`n1lVK(MT@+)PiTK*u
z%ZEfHd7Y=kNMh~W<K!^U@1q;5&Y{8!f$0w?5%%}HL?8utvypN;sl%S)xS(^HvO}){
zr&{oI8$TdA(t|T{YD0d><UmmCeD;zbrLXfZ1EiJjCk5TK?;*$%tV8gWYR#3C0xhJY
z_XE8IvW>wB+qPgg$@>WoAb46G?D|#{+^cYil!pm&1nUWim_PkAyg-l<-_mYW8c5VN
zF_r1KB6}RIneMa=mkaoueG2l;$g8W}dD^}yyWFtM5jcTPs3Oirgaw6j{(%jAX5AlI
Y;xo%GhBV&)ogpl?Z{r((Fa*i!FRIK8<^TWy

diff --git a/src/browser/chrome.py b/src/browser/chrome.py
index c72aac1..964160f 100644
--- a/src/browser/chrome.py
+++ b/src/browser/chrome.py
@@ -161,15 +161,19 @@ class Chrome:
         # White background
         canvas.clear(skia.ColorWHITE)
 
-        # Draw placeholder text
-        paint = skia.Paint()
-        paint.setAntiAlias(True)
-        paint.setColor(skia.ColorBLACK)
-        font = skia.Font(skia.Typeface.MakeDefault(), 20)
-        canvas.drawString("Bowser — M1: Hello World", 20, 50, font, paint)
-
-        # Paint render stats
-        canvas.drawString(f"Window: {width}x{height}", 20, 80, font, paint)
+        # Get content to render
+        content_text = self._get_content_text()
+        
+        if content_text:
+            # Render actual page content with text wrapping
+            self._render_text_content(canvas, content_text, width, height)
+        else:
+            # Show placeholder
+            paint = skia.Paint()
+            paint.setAntiAlias(True)
+            paint.setColor(skia.ColorBLACK)
+            font = skia.Font(skia.Typeface.MakeDefault(), 20)
+            canvas.drawString("Bowser — Enter a URL to browse", 20, 50, font, paint)
 
         # Convert Skia surface to GTK Pixbuf and blit to Cairo context
         image = self.skia_surface.makeImageSnapshot()
@@ -187,6 +191,71 @@ class Chrome:
         Gdk.cairo_set_source_pixbuf(context, pixbuf, 0, 0)
         context.paint()
         self.logger.debug("on_draw end")
+    
+    def _get_content_text(self) -> str:
+        """Extract text content from active tab's document."""
+        if not self.browser.active_tab:
+            return ""
+        
+        frame = self.browser.active_tab.main_frame
+        if not frame.document:
+            return ""
+        
+        # Extract text from document tree
+        return self._extract_text(frame.document)
+    
+    def _extract_text(self, node) -> str:
+        """Recursively extract text from HTML tree."""
+        from ..parser.html import Text, Element
+        
+        if isinstance(node, Text):
+            return node.text
+        elif isinstance(node, Element):
+            texts = []
+            for child in node.children:
+                texts.append(self._extract_text(child))
+            return " ".join(texts)
+        return ""
+    
+    def _render_text_content(self, canvas, text: str, width: int, height: int):
+        """Render text content with basic word wrapping."""
+        paint = skia.Paint()
+        paint.setAntiAlias(True)
+        paint.setColor(skia.ColorBLACK)
+        
+        font_size = 14
+        font = skia.Font(skia.Typeface.MakeDefault(), font_size)
+        
+        # Simple word wrapping
+        words = text.split()
+        lines = []
+        current_line = []
+        current_width = 0
+        max_width = width - 40  # 20px margin on each side
+        
+        for word in words:
+            word_width = font.measureText(word + " ")
+            
+            if current_width + word_width > max_width and current_line:
+                lines.append(" ".join(current_line))
+                current_line = [word]
+                current_width = word_width
+            else:
+                current_line.append(word)
+                current_width += word_width
+        
+        if current_line:
+            lines.append(" ".join(current_line))
+        
+        # Draw lines
+        y = 30
+        line_height = font_size * 1.4
+        
+        for line in lines:
+            if y > height - 20:  # Don't draw past bottom
+                break
+            canvas.drawString(line, 20, y, font, paint)
+            y += line_height
 
     def paint(self):
         """Trigger redraw of the drawing area."""
diff --git a/src/browser/tab.py b/src/browser/tab.py
index f9ff61b..b56371d 100644
--- a/src/browser/tab.py
+++ b/src/browser/tab.py
@@ -4,6 +4,8 @@ from typing import Optional
 import logging
 
 from ..network.url import URL
+from ..network import http
+from ..parser.html import parse_html, Element
 
 
 class Frame:
@@ -11,10 +13,30 @@ class Frame:
         self.tab = tab
         self.parent_frame = parent_frame
         self.frame_element = frame_element
+        self.document: Optional[Element] = None
 
     def load(self, url: URL, payload: Optional[bytes] = None):
-        # TODO: integrate network + parsing + layout + render pipeline
-        self.tab.current_url = url
+        """Fetch and parse the URL content."""
+        try:
+            status, content_type, body = http.request(url, payload)
+            
+            if status == 200:
+                # Decode response
+                text = body.decode('utf-8', errors='replace')
+                
+                # Parse HTML
+                self.document = parse_html(text)
+                self.tab.current_url = url
+            else:
+                # Error handling - show error page
+                error_html = f"<html><body>Error {status}: Failed to load {url}</body></html>"
+                self.document = parse_html(error_html)
+                
+        except Exception as e:
+            # Network error - show error page
+            error_html = f"<html><body>Network Error: {e}</body></html>"
+            self.document = parse_html(error_html)
+            logging.getLogger("bowser.tab").error(f"Failed to load {url}: {e}")
 
 
 class Tab:
diff --git a/src/network/http.py b/src/network/http.py
index 50dadbd..8080f8e 100644
--- a/src/network/http.py
+++ b/src/network/http.py
@@ -1,23 +1,90 @@
 """HTTP requests and response handling."""
 
 import http.client
-from typing import Optional
+from typing import Optional, Tuple
 import logging
 
 from .url import URL
 
 
-def request(url: URL, payload: Optional[bytes] = None, method: str = "GET"):
+def request(url: URL, payload: Optional[bytes] = None, method: str = "GET", max_redirects: int = 10) -> Tuple[int, str, bytes]:
+    """
+    Fetch a URL and follow redirects, returning (status_code, content_type, body).
+    
+    Args:
+        url: URL to fetch
+        payload: Optional request body
+        method: HTTP method (GET, POST, etc.)
+        max_redirects: Maximum number of redirects to follow (default 10)
+    
+    Returns:
+        Tuple of (status_code, content_type, response_body)
+    """
     logger = logging.getLogger("bowser.network")
-    parsed = url._parsed
-    conn_class = http.client.HTTPSConnection if parsed.scheme == "https" else http.client.HTTPConnection
-    conn = conn_class(parsed.hostname, parsed.port or (443 if parsed.scheme == "https" else 80))
-    path = parsed.path or "/"
-    if parsed.query:
-        path = f"{path}?{parsed.query}"
-    headers = {}
-    logger.info(f"HTTP {method} {parsed.scheme}://{parsed.hostname}{path}")
-    conn.request(method, path, body=payload, headers=headers)
-    resp = conn.getresponse()
-    logger.info(f"HTTP response {resp.status} {resp.reason}")
-    return resp
+    current_url = url
+    redirect_count = 0
+    
+    while redirect_count < max_redirects:
+        parsed = current_url._parsed
+        conn_class = http.client.HTTPSConnection if parsed.scheme == "https" else http.client.HTTPConnection
+        
+        try:
+            conn = conn_class(parsed.hostname, parsed.port or (443 if parsed.scheme == "https" else 80))
+            path = parsed.path or "/"
+            if parsed.query:
+                path = f"{path}?{parsed.query}"
+            
+            headers = {
+                "User-Agent": "Bowser/0.0.1",
+                "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",
+            }
+            
+            logger.info(f"HTTP {method} {parsed.scheme}://{parsed.hostname}{path}")
+            conn.request(method, path, body=payload, headers=headers)
+            resp = conn.getresponse()
+            
+            status = resp.status
+            content_type = resp.getheader("Content-Type", "text/html")
+            body = resp.read()
+            
+            logger.info(f"HTTP response {status} {resp.reason} ({len(body)} bytes)")
+            
+            # Handle redirects (3xx status codes)
+            if 300 <= status < 400 and status != 304:
+                location = resp.getheader("Location")
+                conn.close()
+                
+                if not location:
+                    logger.warning(f"Redirect response {status} without Location header")
+                    return status, content_type, body
+                
+                logger.info(f"Following redirect to {location}")
+                redirect_count += 1
+                
+                # Convert relative URLs to absolute
+                if location.startswith("http://") or location.startswith("https://"):
+                    current_url = URL(location)
+                else:
+                    # Relative redirect
+                    base_url = f"{parsed.scheme}://{parsed.hostname}"
+                    if parsed.port:
+                        base_url += f":{parsed.port}"
+                    current_url = URL(base_url + location)
+                
+                # For 303 (See Other), change method to GET
+                if status == 303:
+                    method = "GET"
+                    payload = None
+                
+                continue
+            
+            conn.close()
+            return status, content_type, body
+            
+        except Exception as e:
+            logger.error(f"HTTP request failed: {e}")
+            raise
+    
+    # Max redirects exceeded
+    logger.error(f"Maximum redirects ({max_redirects}) exceeded")
+    raise Exception(f"Too many redirects (max: {max_redirects})")
diff --git a/src/parser/html.py b/src/parser/html.py
index 7293db9..af8ada3 100644
--- a/src/parser/html.py
+++ b/src/parser/html.py
@@ -1,5 +1,7 @@
 """HTML parser stubs."""
 
+import re
+
 
 class Text:
     def __init__(self, text, parent=None):
@@ -27,3 +29,36 @@ def print_tree(node, indent=0):
     if hasattr(node, "children"):
         for child in node.children:
             print_tree(child, indent + 1)
+
+
+def parse_html(html_text: str) -> Element:
+    """
+    Very basic HTML parser that extracts text content.
+    For now, just removes tags and returns a simple tree.
+    """
+    # Strip HTML tags for basic text extraction
+    text_content = re.sub(r'<script[^>]*>.*?</script>', '', html_text, flags=re.DOTALL | re.IGNORECASE)
+    text_content = re.sub(r'<style[^>]*>.*?</style>', '', text_content, flags=re.DOTALL | re.IGNORECASE)
+    text_content = re.sub(r'<[^>]+>', ' ', text_content)
+    
+    # Decode HTML entities
+    text_content = text_content.replace('&lt;', '<')
+    text_content = text_content.replace('&gt;', '>')
+    text_content = text_content.replace('&amp;', '&')
+    text_content = text_content.replace('&quot;', '"')
+    text_content = text_content.replace('&#39;', "'")
+    text_content = text_content.replace('&nbsp;', ' ')
+    
+    # Clean up whitespace
+    text_content = re.sub(r'\s+', ' ', text_content).strip()
+    
+    # Create a simple document structure
+    root = Element("html")
+    body = Element("body", parent=root)
+    root.children.append(body)
+    
+    if text_content:
+        text_node = Text(text_content, parent=body)
+        body.children.append(text_node)
+    
+    return root
diff --git a/tests/test_frame.py b/tests/test_frame.py
new file mode 100644
index 0000000..725b620
--- /dev/null
+++ b/tests/test_frame.py
@@ -0,0 +1,76 @@
+"""Tests for Frame and content loading."""
+
+import pytest
+from unittest.mock import Mock, patch
+from src.browser.tab import Frame, Tab
+from src.network.url import URL
+
+
+class TestFrame:
+    @patch('src.browser.tab.http.request')
+    def test_frame_load_success(self, mock_request):
+        mock_request.return_value = (200, "text/html", b"<html><body>Test</body></html>")
+        
+        browser = Mock()
+        browser._log = Mock()
+        tab = Tab(browser)
+        frame = tab.main_frame
+        
+        url = URL("http://example.com")
+        frame.load(url)
+        
+        assert frame.document is not None
+        assert frame.document.tag == "html"
+        assert tab.current_url == url
+        
+    @patch('src.browser.tab.http.request')
+    def test_frame_load_404(self, mock_request):
+        mock_request.return_value = (404, "text/html", b"Not Found")
+        
+        browser = Mock()
+        browser._log = Mock()
+        tab = Tab(browser)
+        frame = tab.main_frame
+        
+        url = URL("http://example.com/missing")
+        frame.load(url)
+        
+        # Should create error document
+        assert frame.document is not None
+        # Error message in document
+        text = frame.document.children[0].children[0].text if frame.document.children else ""
+        assert "404" in text or "Error" in text
+        
+    @patch('src.browser.tab.http.request')
+    def test_frame_load_network_error(self, mock_request):
+        mock_request.side_effect = Exception("Network unreachable")
+        
+        browser = Mock()
+        browser._log = Mock()
+        tab = Tab(browser)
+        frame = tab.main_frame
+        
+        url = URL("http://unreachable.example.com")
+        frame.load(url)
+        
+        # Should create error document
+        assert frame.document is not None
+        text = frame.document.children[0].children[0].text if frame.document.children else ""
+        assert "Error" in text or "unreachable" in text
+        
+    @patch('src.browser.tab.http.request')
+    def test_frame_load_utf8_decode(self, mock_request):
+        mock_request.return_value = (200, "text/html", "<html><body>Héllo Wörld</body></html>".encode('utf-8'))
+        
+        browser = Mock()
+        browser._log = Mock()
+        tab = Tab(browser)
+        frame = tab.main_frame
+        
+        url = URL("http://example.com")
+        frame.load(url)
+        
+        assert frame.document is not None
+        # Should handle UTF-8 characters
+        text = frame.document.children[0].children[0].text
+        assert "llo" in text  # Part of Héllo
diff --git a/tests/test_html_parsing.py b/tests/test_html_parsing.py
new file mode 100644
index 0000000..618dad6
--- /dev/null
+++ b/tests/test_html_parsing.py
@@ -0,0 +1,82 @@
+"""Tests for HTML parsing functionality."""
+
+import pytest
+from src.parser.html import parse_html, Text, Element
+
+
+class TestParseHTML:
+    def test_parse_simple_text(self):
+        html = "<html><body>Hello World</body></html>"
+        root = parse_html(html)
+        
+        assert isinstance(root, Element)
+        assert root.tag == "html"
+        assert len(root.children) == 1
+        
+        body = root.children[0]
+        assert body.tag == "body"
+        assert len(body.children) == 1
+        
+        text = body.children[0]
+        assert isinstance(text, Text)
+        assert "Hello World" in text.text
+        
+    def test_parse_strips_tags(self):
+        html = "<html><body><p>Hello</p><div>World</div></body></html>"
+        root = parse_html(html)
+        
+        body = root.children[0]
+        text = body.children[0]
+        assert "Hello" in text.text
+        assert "World" in text.text
+        
+    def test_parse_removes_script_tags(self):
+        html = "<html><body>Visible<script>alert('bad')</script>Text</body></html>"
+        root = parse_html(html)
+        
+        body = root.children[0]
+        text = body.children[0]
+        assert "Visible" in text.text
+        assert "Text" in text.text
+        assert "alert" not in text.text
+        assert "script" not in text.text.lower()
+        
+    def test_parse_removes_style_tags(self):
+        html = "<html><body>Text<style>body{color:red;}</style>More</body></html>"
+        root = parse_html(html)
+        
+        body = root.children[0]
+        text = body.children[0]
+        assert "Text" in text.text
+        assert "More" in text.text
+        assert "color" not in text.text
+        
+    def test_parse_decodes_entities(self):
+        html = "<html><body>&lt;div&gt; &amp; &quot;test&quot;</body></html>"
+        root = parse_html(html)
+        
+        body = root.children[0]
+        text = body.children[0]
+        assert "<div>" in text.text
+        assert "&" in text.text
+        assert '"test"' in text.text
+        
+    def test_parse_normalizes_whitespace(self):
+        html = "<html><body>Hello    \n\n   World</body></html>"
+        root = parse_html(html)
+        
+        body = root.children[0]
+        text = body.children[0]
+        # Multiple whitespace should be collapsed
+        assert "Hello World" in text.text
+        
+    def test_parse_empty_document(self):
+        html = "<html><body></body></html>"
+        root = parse_html(html)
+        
+        assert isinstance(root, Element)
+        assert root.tag == "html"
+        body = root.children[0]
+        assert body.tag == "body"
+        # Empty body should have no text children
+        assert len(body.children) == 0
diff --git a/tests/test_http.py b/tests/test_http.py
new file mode 100644
index 0000000..388fc3a
--- /dev/null
+++ b/tests/test_http.py
@@ -0,0 +1,204 @@
+"""Tests for HTTP functionality."""
+
+import pytest
+from unittest.mock import Mock, patch, MagicMock
+from src.network.url import URL
+from src.network import http
+
+
+class TestHTTPRequest:
+    @patch('src.network.http.http.client.HTTPConnection')
+    def test_http_request_success(self, mock_conn_class):
+        # Setup mock
+        mock_conn = Mock()
+        mock_response = Mock()
+        mock_response.status = 200
+        mock_response.reason = "OK"
+        mock_response.getheader.return_value = "text/html"
+        mock_response.read.return_value = b"<html>Hello</html>"
+        
+        mock_conn.getresponse.return_value = mock_response
+        mock_conn_class.return_value = mock_conn
+        
+        # Test
+        url = URL("http://example.com/page")
+        status, content_type, body = http.request(url)
+        
+        assert status == 200
+        assert content_type == "text/html"
+        assert body == b"<html>Hello</html>"
+        
+    @patch('src.network.http.http.client.HTTPSConnection')
+    def test_https_request(self, mock_conn_class):
+        # Setup mock
+        mock_conn = Mock()
+        mock_response = Mock()
+        mock_response.status = 200
+        mock_response.reason = "OK"
+        mock_response.getheader.return_value = "text/html"
+        mock_response.read.return_value = b"Secure content"
+        
+        mock_conn.getresponse.return_value = mock_response
+        mock_conn_class.return_value = mock_conn
+        
+        # Test
+        url = URL("https://example.com")
+        status, content_type, body = http.request(url)
+        
+        assert status == 200
+        assert b"Secure" in body
+        mock_conn_class.assert_called_once()
+        
+    @patch('src.network.http.http.client.HTTPConnection')
+    def test_http_request_404(self, mock_conn_class):
+        # Setup mock
+        mock_conn = Mock()
+        mock_response = Mock()
+        mock_response.status = 404
+        mock_response.reason = "Not Found"
+        mock_response.getheader.return_value = "text/html"
+        mock_response.read.return_value = b"<html>Not Found</html>"
+        
+        mock_conn.getresponse.return_value = mock_response
+        mock_conn_class.return_value = mock_conn
+        
+        # Test
+        url = URL("http://example.com/missing")
+        status, content_type, body = http.request(url)
+        
+        assert status == 404
+        
+    @patch('src.network.http.http.client.HTTPConnection')
+    def test_http_request_with_user_agent(self, mock_conn_class):
+        # Setup mock
+        mock_conn = Mock()
+        mock_response = Mock()
+        mock_response.status = 200
+        mock_response.reason = "OK"
+        mock_response.getheader.return_value = "text/html"
+        mock_response.read.return_value = b"content"
+        
+        mock_conn.getresponse.return_value = mock_response
+        mock_conn_class.return_value = mock_conn
+        
+        # Test
+        url = URL("http://example.com")
+        http.request(url)
+        
+        # Verify User-Agent header was sent
+        call_args = mock_conn.request.call_args
+        headers = call_args[1]['headers']
+        assert 'User-Agent' in headers
+        assert 'Bowser' in headers['User-Agent']
+    
+    @patch('src.network.http.http.client.HTTPConnection')
+    def test_http_redirect_301(self, mock_conn_class):
+        """Test following 301 permanent redirect."""
+        # Setup mock for first request (redirect)
+        mock_conn = Mock()
+        mock_response_redirect = Mock()
+        mock_response_redirect.status = 301
+        mock_response_redirect.reason = "Moved Permanently"
+        mock_response_redirect.getheader.side_effect = lambda header, default="": {
+            "Content-Type": "text/html",
+            "Location": "http://example.com/new-page"
+        }.get(header, default)
+        mock_response_redirect.read.return_value = b"<html>Redirect</html>"
+        
+        # Setup mock for second request (final response)
+        mock_response_final = Mock()
+        mock_response_final.status = 200
+        mock_response_final.reason = "OK"
+        mock_response_final.getheader.side_effect = lambda header, default="": {
+            "Content-Type": "text/html",
+        }.get(header, default)
+        mock_response_final.read.return_value = b"<html>Final content</html>"
+        
+        mock_conn.getresponse.side_effect = [mock_response_redirect, mock_response_final]
+        mock_conn_class.return_value = mock_conn
+        
+        # Test
+        url = URL("http://example.com/old-page")
+        status, content_type, body = http.request(url)
+        
+        assert status == 200
+        assert body == b"<html>Final content</html>"
+        assert mock_conn.request.call_count == 2
+    
+    @patch('src.network.http.http.client.HTTPConnection')
+    def test_http_redirect_302(self, mock_conn_class):
+        """Test following 302 temporary redirect."""
+        # Setup mock for first request (redirect)
+        mock_conn = Mock()
+        mock_response_redirect = Mock()
+        mock_response_redirect.status = 302
+        mock_response_redirect.reason = "Found"
+        mock_response_redirect.getheader.side_effect = lambda header, default="": {
+            "Content-Type": "text/html",
+            "Location": "http://example.com/temp-page"
+        }.get(header, default)
+        mock_response_redirect.read.return_value = b"<html>Redirect</html>"
+        
+        # Setup mock for second request (final response)
+        mock_response_final = Mock()
+        mock_response_final.status = 200
+        mock_response_final.reason = "OK"
+        mock_response_final.getheader.side_effect = lambda header, default="": {
+            "Content-Type": "text/html",
+        }.get(header, default)
+        mock_response_final.read.return_value = b"<html>Temp content</html>"
+        
+        mock_conn.getresponse.side_effect = [mock_response_redirect, mock_response_final]
+        mock_conn_class.return_value = mock_conn
+        
+        # Test
+        url = URL("http://example.com/old-page")
+        status, content_type, body = http.request(url)
+        
+        assert status == 200
+        assert body == b"<html>Temp content</html>"
+    
+    @patch('src.network.http.http.client.HTTPConnection')
+    def test_http_redirect_no_location(self, mock_conn_class):
+        """Test handling of redirect without Location header."""
+        # Setup mock
+        mock_conn = Mock()
+        mock_response = Mock()
+        mock_response.status = 302
+        mock_response.reason = "Found"
+        mock_response.getheader.side_effect = lambda header, default="": {
+            "Content-Type": "text/html",
+        }.get(header, default)
+        mock_response.read.return_value = b"<html>Redirect</html>"
+        
+        mock_conn.getresponse.return_value = mock_response
+        mock_conn_class.return_value = mock_conn
+        
+        # Test
+        url = URL("http://example.com/page")
+        status, content_type, body = http.request(url)
+        
+        # Should return the redirect response if no Location header
+        assert status == 302
+        assert body == b"<html>Redirect</html>"
+    
+    @patch('src.network.http.http.client.HTTPConnection')
+    def test_http_max_redirects(self, mock_conn_class):
+        """Test that max redirects limit is enforced."""
+        # Setup mock that always returns a redirect
+        mock_conn = Mock()
+        mock_response = Mock()
+        mock_response.status = 302
+        mock_response.reason = "Found"
+        mock_response.getheader.side_effect = lambda header, default="": {
+            "Location": "http://example.com/redirect-loop"
+        }.get(header, default)
+        mock_response.read.return_value = b""
+        
+        mock_conn.getresponse.return_value = mock_response
+        mock_conn_class.return_value = mock_conn
+        
+        # Test with max_redirects=2
+        url = URL("http://example.com/page")
+        with pytest.raises(Exception, match="Too many redirects"):
+            http.request(url, max_redirects=2)