ViewVC Help
View File | Revision Log | Show Annotations | Download File | View Changeset | Root Listing
root/proj/trunk/Search/HttpHandler.cpp
(Generate patch)

Comparing trunk/Search/HttpHandler.cpp (file contents):
Revision 13 by douglas, 2002-12-06T19:56:56-08:00 vs.
Revision 24 by douglas, 2002-12-22T00:58:21-08:00

# Line 52 | Line 52
52  
53   HttpHandler::HttpHandler()
54   {
55 +        buffer = new char[BUFSIZ + 1];
56 +
57   #ifdef _WIN32
58 <        WSADATA data;
57 <        if (WSAStartup(MAKEWORD(2, 0) != 0, &data))
58 >        if (WSAStartup(MAKEWORD(2, 0), &data) != 0)
59          {
60 <                error(program + ": WSAStartup()");
60 >                error(program + ": WSAStartup");
61                  exit(1);
62          }
63   #endif // _WIN32
64  
65 <        begin = 0;
65 >        length = 0;
66 >        chunked = false;
67   }
68  
69   HttpHandler::~HttpHandler()
70   {
71 +        delete [] buffer;
72 +
73   #ifdef _WIN32
74          WSACleanup();
75   #endif // _WIN32
76   }
77  
78 < bool HttpHandler::connect(URL &url, bool head)
78 > bool HttpHandler::handle(URL &url, bool head)
79   {
80          bool answer = false;
81  
82 < //      if (status != JNI_ERR)
83 < //      {
84 < //              if (cls != 0)
85 < //              {
86 < //                      if (mid != 0)
87 < //                      {
88 < //                              jstring addressJ = env->NewStringUTF(url.getAddress().c_str());
89 < //                              jint portJ = url.getPort();
90 < //                              jstring pathJ = env->NewStringUTF(url.getPath().c_str());
91 < //                              jstring programNameJ = env->NewStringUTF(programName.c_str());
92 < //                              jstring programVersionJ =
93 < //                                      env->NewStringUTF(programVersion.c_str());
94 <
95 < //                              jstring pageJ = (jstring)env->CallStaticObjectMethod(cls, mid,
96 < //                                      addressJ, portJ, pathJ, programNameJ, programVersionJ);
97 <
98 < //                              const char* pageC = env->GetStringUTFChars(pageJ, 0);
99 < //                              page = pageC;
100 < //                              env->ReleaseStringUTFChars(pageJ, pageC);
101 <
102 < //                              if (page != "unknown host\n" && page != "io exception\n" &&
103 < //                                      page != "bad headers\n") answer = true;
104 < //                      }
105 < //              }
106 < //      }
82 >        if ((http = socket(PF_INET, SOCK_STREAM, 0)) == INVALID_SOCKET)
83 >        {
84 >                error(program + ": Socket");
85 >                exit(1);
86 >        }
87 >
88 >        sockaddr_in address;
89 >        hostent* host;
90 >
91 >        address.sin_family = AF_INET;
92 >
93 >        if ((host = gethostbyname(url.getAddress().c_str())) == NULL)
94 >        {
95 >                error(program + ": Host: " + url.getAddress(), true);
96 >                return answer;
97 >        }
98 >
99 >        address.sin_addr = *((in_addr*)*host->h_addr_list);
100 >        address.sin_port = htons(url.getPort());
101 >
102 >        if (connect(http, (sockaddr*)&address, sizeof(sockaddr_in)) ==
103 >                SOCKET_ERROR)
104 >        {
105 >                error(program + ": Connect");
106 >                return answer;
107 >        }
108 >
109 >        if (head)
110 >        {
111 >                putline("HEAD " + url.getPath() + " HTTP/1.1");
112 >        }
113 >        else
114 >        {
115 >                putline("GET " + url.getPath() + " HTTP/1.1");
116 >        }
117 >
118 >        putline("Accept: text/html; text/plain");
119 >        putline("User-Agent: " + agent(true) + ' ' + platform());
120 >
121 >        if (url.getPort() == 80)
122 >        {
123 >                putline("Host: " + url.getAddress());
124 >        }
125 >        else
126 >        {
127 >                char* port = new char[1024];
128 >                sprintf(port, "%u", url.getPort());
129 >
130 >                putline("Host: " + url.getAddress() + ':' + port);
131 >
132 >                delete [] port;
133 >        }
134 >
135 > //      putline("Referer: " + ¿referer?);
136 >        putline("Connection: close");
137 >        putline();
138 >
139 >        code response;
140 >        string line;
141 >
142 >        do
143 >        {
144 >                line = getline();
145 >
146 >                if (line.find("HTTP/") != 0)
147 >                {
148 >                        return answer;
149 >                }
150 >
151 >                unsigned dot = line.find('.');
152 >                unsigned space = line.find(' ');
153 >
154 >                unsigned major = strtoul(line.substr(5, dot - 5).c_str(), 0, 10);
155 >                unsigned minor = strtoul(line.substr(dot + 1, space - dot - 1).c_str(),
156 >                        0, 10);
157 >
158 >                if (major > 1)
159 >                {
160 >                        cerr << program << ": Potentially Incompatible Server: HTTP/" <<
161 >                                major << "." << minor << "\n";
162 >
163 >                        return answer;
164 >                }
165 >
166 >                response = code(strtoul(line.substr(space + 1).c_str(), 0, 10));
167 >
168 >                if (response < ok) do line = getline(); while (line != "");
169 >        }
170 >        while (response < ok);
171 >
172 >        do
173 >        {
174 >                line = getline();
175 >
176 >                if (line != "")
177 >                {
178 >                        unsigned colon = line.find(':');
179 >
180 >                        string field = line.substr(0, colon);
181 >                        string value = line.substr(colon + 1);
182 >
183 >                        while (isspace(value[0])) value.erase(0, 1);
184 >
185 >                        if (field == "Content-Type")
186 >                        {
187 >                                type = value;
188 >                        }
189 >                        else if (field == "Content-Length")
190 >                        {
191 >                                length = strtoul(value.c_str(), 0, 10);
192 >                        }
193 >                        else if (field == "Location")
194 >                        {
195 >                                location = value;
196 >                        }
197 >                        else if (field == "Transfer-Encoding")
198 >                        {
199 >                                chunked = value == "chunked";
200 >                        }
201 >                }
202 >        }
203 >        while (line != "");
204 >
205 >        switch (response)
206 >        {
207 >        case ok:
208 >                if (debug) cerr << "response = " << response << "\n";
209 >                answer = true;
210 >                break;
211 >        case choices:
212 >        case moved:
213 >        case found:
214 >                if (debug) cerr << "response = " << response << "\n"
215 >                        << "location = " << location << "\n";
216 >                location = getLink(location, url);
217 >                break;
218 >        case notfound:
219 >        case internal:
220 >                if (debug) cerr << "response = " << response << "\n";
221 >                break;
222 >        default:
223 >                if (debug) cerr << "response = " << response << "\n";
224 >                if (response <= 299)
225 >                {
226 >                        answer = true;
227 >                }
228 >                else if (response <= 399)
229 >                {
230 >                        location = getLink(location, url);
231 >                }
232 >                break;
233 >        }
234 >
235 >        if (!head && answer) populate();
236  
237          return answer;
238   }
239  
240   HttpHandler& HttpHandler::getline(string& line, char endline)
241   {
242 <        int end = page.find(endline, begin);
243 <        int newline = page.find('\n', begin);
242 >        unsigned end = page.find(endline);
243 >        unsigned newline = page.find('\n');
244  
245          if (newline < end || end == string::npos)
246          {
247                  end = newline;
248          }
249  
250 <        line = page.substr(begin, end - begin);
250 >        line = page.substr(0, end);
251 >        page.erase(0, (end == string::npos ? end : end + 1));
252 >
253 >        return *this;
254 > }
255 >
256 > void HttpHandler::clear()
257 > {
258 >        closesocket(http);
259 >
260 >        type = "";
261 >        length = 0;
262 >        location = "";
263 >        page = "";
264 >        chunked = false;
265 > }
266  
267 <        if (end == string::npos)
267 > void HttpHandler::populate()
268 > {
269 >        if (!chunked)
270          {
271 <                begin = end;
271 >                unsigned left = length;
272 >
273 >                while (left > 0)
274 >                {
275 >                        memset(buffer, 0, BUFSIZ + 1);
276 >
277 >                        unsigned bytes = left > BUFSIZ ? BUFSIZ : left;
278 >                        unsigned received;
279 >
280 >                        if ((received = recv(http, buffer, bytes, 0)) == SOCKET_ERROR)
281 >                        {
282 >                                error(program + ": Recv");
283 >                                exit(1);
284 >                        }
285 >                        else if (received != bytes)
286 >                        {
287 >                                left -= received;
288 >                                page += buffer;
289 >
290 >                                memset(buffer, 0, BUFSIZ + 1);
291 >
292 >                                bytes -= received;
293 >                                if (recv(http, buffer, bytes, 0) == SOCKET_ERROR)
294 >                                {
295 >                                        error(program + ": Recv");
296 >                                        exit(1);
297 >                                }
298 >                        }
299 >
300 >                        page += buffer;
301 >                        left -= bytes;
302 >                }
303          }
304          else
305          {
306 <                begin = end + 1;
306 >                unsigned chunk;
307 >
308 >                do
309 >                {
310 >                        chunk = strtoul(getline().c_str(), 0, 16);
311 >
312 >                        unsigned left = chunk;
313 >
314 >                        while (left > 0)
315 >                        {
316 >                                memset(buffer, 0, BUFSIZ + 1);
317 >
318 >                                unsigned bytes = left > BUFSIZ ? BUFSIZ : left;
319 >                                unsigned received;
320 >
321 >                                if ((received = recv(http, buffer, bytes, 0)) == SOCKET_ERROR)
322 >                                {
323 >                                        error(program + ": Recv");
324 >                                        exit(1);
325 >                                }
326 >                                else if (received != bytes)
327 >                                {
328 >                                        left -= received;
329 >                                        page += buffer;
330 >
331 >                                        memset(buffer, 0, BUFSIZ + 1);
332 >
333 >                                        bytes -= received;
334 >                                        if (recv(http, buffer, bytes, 0) == SOCKET_ERROR)
335 >                                        {
336 >                                                error(program + ": Recv");
337 >                                                exit(1);
338 >                                        }
339 >                                }
340 >
341 >                                page += buffer;
342 >                                left -= bytes;
343 >                        }
344 >
345 >                        getline();
346 >                        length += chunk;
347 >                }
348 >                while (chunk > 0);
349          }
350  
351 <        return *this;
351 >        for (unsigned index = 0; index < page.length(); index++)
352 >        {
353 >                if (page[index] == '\r' && (index + 1 < page.length()) ? page[index +
354 >                        1] == '\n' : false)
355 >                {
356 >                        page.erase(index, 1);
357 >                }
358 >                else if (page[index] == '\r')
359 >                {
360 >                        page[index] = '\n';
361 >                }
362 >        }
363   }
364  
365 < bool HttpHandler::good()
365 > void HttpHandler::putline(const string line)
366   {
367 <        bool answer = true;
368 <
135 <        if (begin >= page.length())
136 <        {
137 <                answer = false;
138 <        }
139 <        else if (begin == string::npos)
367 >        sprintf(buffer, "%s\r\n", line.c_str());
368 >        if (send(http, buffer, strlen(buffer), 0) == SOCKET_ERROR)
369          {
370 <                answer = false;
370 >                error(program + ": Send");
371 >                exit(1);
372          }
143
144        return answer;
373   }
374  
375 < void HttpHandler::clear()
375 > string HttpHandler::getline()
376   {
377 <        begin = 0;
378 <        page = "";
377 >        string line;
378 >        char byte;
379 >
380 >        do
381 >        {
382 >                if (recv(http, &byte, 1, 0) == SOCKET_ERROR)
383 >                {
384 >                        error(program + ": Recv");
385 >                }
386 >
387 >                if (byte != '\r' && byte != '\n')
388 >                {
389 >                        line += byte;
390 >                }
391 >        }
392 >        while (byte != '\n');
393 >
394 >        return line;
395   }
396  
397 < void HttpHandler::error(const string prefix, bool host)
397 > void HttpHandler::error(const string& prefix, bool host)
398   {
399   #ifdef _WIN32
400          string error;

Diff Legend

Removed lines
+ Added lines
< Changed lines
> Changed lines