ViewVC Help
View File | Revision Log | Show Annotations | Download File | View Changeset | Root Listing
root/proj/trunk/Search/HttpHandler.cpp
(Generate patch)

Comparing trunk/Search/HttpHandler.cpp (file contents):
Revision 17 by douglas, 2002-12-09T18:31:11-08:00 vs.
Revision 178 by douglas, 2003-07-05T19:13:12-07:00

# Line 1 | Line 1
1   /* ============================================================================
2   * Douglas Thrift's Search Engine License
3   *
4 < * Copyright (C) 2002, Douglas Thrift. All Rights Reserved.
4 > * Copyright (C) 2002-2003, Douglas Thrift. All Rights Reserved.
5   * Redistribution and use in source and binary forms, with or without
6   * modification, are permitted provided that the following conditions are met:
7   *
# Line 50 | Line 50
50  
51   #include "HttpHandler.h"
52  
53 + #ifndef _WIN32
54 + #include <unistd.h>
55 + #include <sys/types.h>
56 + #include <sys/socket.h>
57 + #include <netinet/in.h>
58 + #include <netdb.h>
59 +
60 + #define INVALID_SOCKET -1
61 + #define SOCKET_ERROR -1
62 +
63 + inline int closesocket(SOCKET s) { return close(s); }
64 + #endif
65 +
66   HttpHandler::HttpHandler()
67   {
68          buffer = new char[BUFSIZ + 1];
# Line 62 | Line 75 | HttpHandler::HttpHandler()
75          }
76   #endif // _WIN32
77  
78 <        begin = 0;
78 >        length = 0;
79 >        chunked = false;
80   }
81  
82   HttpHandler::~HttpHandler()
# Line 74 | Line 88 | HttpHandler::~HttpHandler()
88   #endif // _WIN32
89   }
90  
91 < bool HttpHandler::handle(URL &url, bool head)
91 > bool HttpHandler::handle(URL &url, const string referer, bool head)
92   {
93          bool answer = false;
94  
# Line 131 | Line 145 | bool HttpHandler::handle(URL &url, bool
145                  delete [] port;
146          }
147  
148 +        if (referer != "")
149 +        {
150 +                putline("Referer: " + referer);
151 +        }
152 +
153 +        putline("Connection: close");
154          putline();
155  
156 <        string line = getline();
156 >        code response;
157 >        string line;
158  
159 <        if (line.find("HTTP/") != 0)
159 >        do
160          {
161 <                return answer;
141 <        }
161 >                line = getline();
162  
163 <        unsigned dot = line.find('.');
164 <        unsigned space = line.find(' ');
163 >                if (line.find("HTTP/") != 0)
164 >                {
165 >                        return answer;
166 >                }
167  
168 <        unsigned major = strtoul(line.substr(5, dot - 5).c_str(), 0, 0);
169 <        unsigned minor = strtoul(line.substr(dot + 1, space - dot - 1).c_str(), 0,
148 <                0);
168 >                unsigned dot = line.find('.');
169 >                unsigned space = line.find(' ');
170  
171 <        if (major > 1 || minor < 1)
172 <        {
173 <                cerr << program << ": Potentially Incompatible Server: HTTP/" << major
153 <                        << "." << minor << "\n";
171 >                unsigned major = strtoul(line.substr(5, dot - 5).c_str(), 0, 10);
172 >                unsigned minor = strtoul(line.substr(dot + 1, space - dot - 1).c_str(),
173 >                        0, 10);
174  
175 <                return answer;
176 <        }
175 >                if (major > 1)
176 >                {
177 >                        cerr << program << ": Potentially Incompatible Server: HTTP/" <<
178 >                                major << "." << minor << "\n";
179 >
180 >                        return answer;
181 >                }
182  
183 <        code response = code(strtoul(line.substr(space + 1).c_str(), 0, 0));
183 >                response = code(strtoul(line.substr(space + 1).c_str(), 0, 10));
184 >
185 >                if (response < ok) do line = getline(); while (line != "");
186 >        }
187 >        while (response < ok);
188  
189          do
190          {
191                  line = getline();
192 +
193 +                if (line != "")
194 +                {
195 +                        unsigned colon = line.find(':');
196 +
197 +                        string field = line.substr(0, colon);
198 +                        string value = line.substr(colon + 1);
199 +
200 +                        while (isspace(value[0])) value.erase(0, 1);
201 +
202 +                        if (field == "Content-Type")
203 +                        {
204 +                                type = value;
205 +                        }
206 +                        else if (field == "Content-Length")
207 +                        {
208 +                                length = strtoul(value.c_str(), 0, 10);
209 +                        }
210 +                        else if (field == "Location")
211 +                        {
212 +                                location = value;
213 +                        }
214 +                        else if (field == "Transfer-Encoding")
215 +                        {
216 +                                chunked = value == "chunked";
217 +                        }
218 +                }
219          }
220          while (line != "");
221  
222          switch (response)
223          {
224          case ok:
225 +                if (debug) cerr << "response = " << response << "\n";
226                  answer = true;
227                  break;
228 <        case choices:
172 <                break;
228 >        case choices:
229          case moved:
174                break;
230          case found:
231 +                if (debug) cerr << "response = " << response << "\n"
232 +                        << "location = " << location << "\n";
233 +                location = getLink(location, url);
234                  break;
235          case notfound:
178                break;
236          case internal:
237 +                if (debug) cerr << "response = " << response << "\n";
238                  break;
239          default:
240 +                if (debug) cerr << "response = " << response << "\n";
241 +                if (response <= 299)
242 +                {
243 +                        answer = true;
244 +                }
245 +                else if (response <= 399)
246 +                {
247 +                        location = getLink(location, url);
248 +                }
249                  break;
250          }
251  
252 +        if (!head && answer) populate();
253 +
254          return answer;
255   }
256  
257   HttpHandler& HttpHandler::getline(string& line, char endline)
258   {
259 <        int end = page.find(endline, begin);
260 <        int newline = page.find('\n', begin);
259 >        unsigned end = page.find(endline);
260 >        unsigned newline = page.find('\n');
261  
262          if (newline < end || end == string::npos)
263          {
264                  end = newline;
265          }
266  
267 <        line = page.substr(begin, end - begin);
268 <
200 <        if (end == string::npos)
201 <        {
202 <                begin = end;
203 <        }
204 <        else
205 <        {
206 <                begin = end + 1;
207 <        }
267 >        line = page.substr(0, end);
268 >        page.erase(0, (end == string::npos ? end : end + 1));
269  
270          return *this;
271   }
272  
273 < bool HttpHandler::good()
273 > void HttpHandler::clear()
274   {
275 <        bool answer = true;
275 >        closesocket(http);
276 >
277 >        type = "";
278 >        length = 0;
279 >        location = "";
280 >        page = "";
281 >        chunked = false;
282 > }
283  
284 <        if (begin >= page.length())
284 > void HttpHandler::populate()
285 > {
286 >        if (!chunked)
287          {
288 <                answer = false;
288 >                unsigned left = length;
289 >
290 >                while (left > 0)
291 >                {
292 >                        memset(buffer, 0, BUFSIZ + 1);
293 >
294 >                        unsigned bytes = left > BUFSIZ ? BUFSIZ : left;
295 >                        unsigned received;
296 >
297 >                        while (true)
298 >                        {
299 >                                if ((received = recv(http, buffer, bytes, 0)) == SOCKET_ERROR)
300 >                                {
301 >                                        error(program + ": Recv");
302 >                                        exit(1);
303 >                                }
304 >                                else if (received != bytes)
305 >                                {
306 >                                        left -= received;
307 >                                        page += buffer;
308 >
309 >                                        memset(buffer, 0, BUFSIZ + 1);
310 >
311 >                                        bytes -= received;
312 >                                }
313 >                                else
314 >                                {
315 >                                        break;
316 >                                }
317 >                        }
318 >
319 >                        page += buffer;
320 >                        left -= bytes;
321 >                }
322          }
323 <        else if (begin == string::npos)
323 >        else
324          {
325 <                answer = false;
223 <        }
325 >                unsigned chunk;
326  
327 <        return answer;
328 < }
327 >                do
328 >                {
329 >                        chunk = strtoul(getline().c_str(), 0, 16);
330  
331 < void HttpHandler::clear()
332 < {
333 <        type = "";
334 <        length = 0;
335 <        location = "";
336 <        begin = 0;
337 <        page = "";
331 >                        unsigned left = chunk;
332 >
333 >                        while (left > 0)
334 >                        {
335 >                                memset(buffer, 0, BUFSIZ + 1);
336 >
337 >                                unsigned bytes = left > BUFSIZ ? BUFSIZ : left;
338 >                                unsigned received;
339 >
340 >                                while (true)
341 >                                {
342 >                                        if ((received = recv(http, buffer, bytes, 0)) ==
343 >                                                SOCKET_ERROR)
344 >                                        {
345 >                                                error(program + ": Recv");
346 >                                                exit(1);
347 >                                        }
348 >                                        else if (received != bytes)
349 >                                        {
350 >                                                left -= received;
351 >                                                page += buffer;
352 >
353 >                                                memset(buffer, 0, BUFSIZ + 1);
354 >
355 >                                                bytes -= received;
356 >                                        }
357 >                                        else
358 >                                        {
359 >                                                break;
360 >                                        }
361 >                                }
362 >
363 >                                page += buffer;
364 >                                left -= bytes;
365 >                        }
366 >
367 >                        getline();
368 >                        length += chunk;
369 >                }
370 >                while (chunk > 0);
371 >        }
372 >
373 >        for (unsigned index = 0; index < page.length(); index++)
374 >        {
375 >                if (page[index] == '\r' && (index + 1 < page.length()) ? page[index +
376 >                        1] == '\n' : false)
377 >                {
378 >                        page.erase(index, 1);
379 >                }
380 >                else if (page[index] == '\r')
381 >                {
382 >                        page[index] = '\n';
383 >                }
384 >        }
385   }
386  
387   void HttpHandler::putline(const string line)
# Line 266 | Line 416 | string HttpHandler::getline()
416          return line;
417   }
418  
419 < void HttpHandler::error(const string prefix, bool host)
419 > void HttpHandler::error(const string& prefix, bool host)
420   {
421   #ifdef _WIN32
422          string error;

Diff Legend

Removed lines
+ Added lines
< Changed lines
> Changed lines