]> source.dussan.org Git - jgit.git/log
jgit.git
14 years agohttp.server: Use TemporaryBuffer and compress some responses 06/306/2
Shawn O. Pearce [Fri, 12 Feb 2010 02:53:22 +0000 (18:53 -0800)]
http.server: Use TemporaryBuffer and compress some responses

The HTTP server side code now uses the same approach that the smart
HTTP client code uses when preparing a request body.  The payload
is streamed into a TemporaryBuffer of limited size.  If the entire
data fits, its compressed with gzip if the user agent supports that,
and a Content-Length header is used to transmit the fixed length
body to the peer.  If however the data overflows the limited memory
segment, its streamed uncompressed to the peer.

One might initially think that larger contents which overflow
the buffer should also be compressed, rather than sent raw, since
they were deemed "large".  But usually these larger contents are
actually a pack file which has been already heavily compressed by
Git specific routines.  Trying to deflate that with gzip is probably
going to take up more space, not less, so the compression overhead
isn't worthwhile.

This buffer and compress optimization helps repositories with a
large number of references, as their text based advertisements
compress well. For example jgit's own native repository currently
requires 32,628 bytes for its full advertisement of 489 references.
Most repositories have fewer references, and thus could compress
their entire response in one buffer.

Change-Id: I790609c9f763339e0a1db9172aa570e29af96f42
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoReduce multi-level buffered streams in transport code 05/305/2
Shawn O. Pearce [Fri, 12 Feb 2010 02:10:45 +0000 (18:10 -0800)]
Reduce multi-level buffered streams in transport code

Some transports actually provide stream buffering on their own,
without needing to be wrapped up inside of a BufferedInputStream in
order to smooth out system calls to read or write.  A great example
of this is the JSch SSH client, or the Apache MINA SSHD server.
Both use custom buffering to packetize the streams into the encrypted
SSH channel, and wrapping them up inside of a BufferedInputStream
or BufferedOutputStream is relatively pointless.

Our SideBandOutputStream implementation also provides some fairly
large buffering, equal to one complete side-band packet on the main
data channel.  Wrapping that inside of a BufferedOutputStream just to
smooth out small writes from PackWriter causes extra data copies, and
provides no advantage.  We can save some memory and some CPU cycles
by letting PackWriter dump directly into the SideBandOutputStream's
internal buffer array.

Instead we push the buffering streams down to be as close to the
network socket (or operating system pipe) as possible.  This allows
us to smooth out the smaller reads/writes from pkt-line messages
during advertisement and negotation, but avoid copying altogether
when the stream switches to larger writes over a side band channel.

Change-Id: I2f6f16caee64783c77d3dd1b2a41b3cc0c64c159
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoFix smart HTTP client buffer alignment 04/304/2
Shawn O. Pearce [Fri, 12 Feb 2010 02:02:22 +0000 (18:02 -0800)]
Fix smart HTTP client buffer alignment

This proved to be a pretty difficult to find bug.  If we read exactly
the number of response bytes from the UnionInputStream and didn't
try to read beyond that length, the last connection's InputStream is
still inside of the UnionInputStream, and UnionInputStream.isEmpty()
returns false.  But there is no data present, so the next read
request to our UnionInputStream returns EOF at a point where the
HTTP client code should have started a new request in order to get
more data.

Instead of wrapping the UnionInputStream, push an dummy stream onto
the end of it which when invoked always starts the next request and
then returns EOF.  The UnionInputStream will automatically pop that
dummy stream out, and then read the next request's stream.

This way we never get into the state where we don't think we need
to run another request in order to satisfy the current read request,
but we really do.

The bug was hidden for so long because BasePackConnection.init()
was always wrapping the InputStream into a BufferedInputStream
with an 8 KiB buffer.  This made the odds of us reading from the
UnionInputStream the exact number of available bytes quite low, as
the BufferedInputStream would always try to read a full buffer size.

Change-Id: I02b5ec3ef6853688687d91de000a5fbe2354915d
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoUse "ERR message" for early ReceivePack problems 01/301/2
Shawn O. Pearce [Thu, 11 Feb 2010 18:58:22 +0000 (10:58 -0800)]
Use "ERR message" for early ReceivePack problems

If the application wants to, it can use sendError(String) to send one
or more error messages to clients before the advertisements are sent.
These will cause a C Git client to break out of the advertisement
parsing loop, display "remote error: message\n", and terminate.

Servers can optionally use this to send a detailed error to a client
explaining why it cannot use the ReceivePack service on a repository.
Over smart HTTP these errors are sent in a 200 OK response, and
are in the payload, allowing the Git client to give the end-user
the custom message rather than the generic error "403 Forbidden".

Change-Id: I03f4345183765d21002118617174c77f71427b5a
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoCatch and report "ERR message" during remote advertisements 00/300/2
Shawn O. Pearce [Thu, 11 Feb 2010 19:43:29 +0000 (11:43 -0800)]
Catch and report "ERR message" during remote advertisements

GitHub broke the native git protocol a while ago by interjecting an
"ERR message" line into the upload-pack or receive-pack advertisement
list.  This didn't match the expected pattern, so it caused existing
C Git clients to abort with a protocol exception.

These days, C Git clients actually look for this message and abort
with a more graceful notice to the end-user.  JGit should do the
same, including setting up a custom exception type that makes it
easier for higher-level UIs to identify a message from the remote
site and present it to the user.

Change-Id: I51ab62a382cfaf1082210e8bfaa69506fd0d9786
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoWait for EOF on stderr before finishing SSH channel 95/295/3
Shawn O. Pearce [Thu, 11 Feb 2010 03:54:07 +0000 (19:54 -0800)]
Wait for EOF on stderr before finishing SSH channel

JSch will allow us to close the connection and then just drop
any late messages coming over the stderr stream for the command.
This makes it easy to lose final output on a command, like from
Gerrit Code Review's post receive hook.

Instead spawn a background thread to copy data from JSch's pipe
into our own buffer, and wait for that thread to receive EOF on the
pipe before we declare the connection closed. This way we don't
have a race condition between the stderr data arriving and JSch
just tearing down the channel.

Change-Id: Ica1ba40ed2b4b6efb7d5e4ea240efc0a56fb71f6
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoCapture non-progress side band #2 messages and put in result 93/293/5
Shawn O. Pearce [Wed, 10 Feb 2010 19:49:27 +0000 (11:49 -0800)]
Capture non-progress side band #2 messages and put in result

Any messages received on side band #2 that aren't scraped as a
progress message into our ProgressMonitor are now forwarded to a
buffer which is later included into the OperationResult object.
Application callers can use this buffer to present the additional
messages from the remote peer after the push or fetch operation
has concluded.

The smart push connections using the native send-pack/receive-pack
protocol now request side-band-64k capability if it is available
and forward any messages received through that channel onto this
message buffer.  This makes hook messages available over smart HTTP,
or even over SSH.

The SSH transport was modified to redirect the remote command's
stderr stream into the message buffer, interleaved with any data
received over side band #2.  Due to buffering between these two
different channels in the SSH channel mux itself the order of any
writes between the two cannot be ensured, but it tries to stay close.

The local fork transport was also modified to redirect the local
receive-pack's stderr into the message buffer, rather than going to
the invoking JVM's System.err.  This gives applications a chance
to log the local error messages, rather than needing to redirect
their JVM's stderr before startup.

To keep things simple, the application has to wait for the entire
operation to complete before it can see the messages.  This may
be a downside if the user is trying to debug a remote hook that is
blocking indefinitely, the user would need to abort the connection
before they can inspect the message buffer in any sort of UI built
on top of JGit.

Change-Id: Ibc215f4569e63071da5b7e5c6674ce924ae39e11
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoReceivePack: Enable side-band-64k capability for status reports 92/292/5
Shawn O. Pearce [Tue, 9 Feb 2010 03:18:51 +0000 (19:18 -0800)]
ReceivePack: Enable side-band-64k capability for status reports

We now advertise the side-band-64k capability inside of ReceivePack,
allowing hooks to echo status messages down the side band channel
instead of over the optional stderr stream.

This change permits hooks running inside of an http:// based push
invocation to still message the end-user with more detailed errors
than the small per-command string in the status report.

Change-Id: I64f251ef2d13ab3fd0e1a319a4683725455e5244
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoUse more restrictive patterns for sideband progress scraping 91/291/4
Shawn O. Pearce [Tue, 9 Feb 2010 18:46:01 +0000 (10:46 -0800)]
Use more restrictive patterns for sideband progress scraping

To avoid scraping a non-progress message as though it were a progress
item for the progress monitor, use a more restrictive pattern to
watch the remote side's messages.  These two regexps should match
any message produced by C Git since 42e18fbf5f94 ("more compact
progress display", Oct 2007), and which first appeared in Git 1.5.4.

Change-Id: I57e34cf59d42c1dbcbd1a83dd6f499ce5e39d15d
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoPrefix remote progress tasks with "remote: " 90/290/4
Shawn O. Pearce [Tue, 9 Feb 2010 18:39:15 +0000 (10:39 -0800)]
Prefix remote progress tasks with "remote: "

When we pull task messages off the remote peer via sideband #2
prefix them with the string "remote: " to make it clear to the
user these are coming from the other system, and not from their
local client.

Change-Id: I02c5e67c6be67e30e40d3bc4be314d6640feb519
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoDecode side-band channel number as unsigned integer 89/289/4
Shawn O. Pearce [Tue, 9 Feb 2010 17:44:24 +0000 (09:44 -0800)]
Decode side-band channel number as unsigned integer

This field is unsigned in the protocol, so treat it
as such when we report the channel number in errors.

Change-Id: I20a52809c7a756e9f66b3557a4300ae1e11f6d25
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoRefactor SideBandInputStream construction 88/288/4
Shawn O. Pearce [Tue, 9 Feb 2010 17:14:00 +0000 (09:14 -0800)]
Refactor SideBandInputStream construction

Typically we refer to the raw InputStream (the stream without the
pkt-line headers on it) as rawIn, and the pkt-line header variant
as pckIn.  Refactor our fields to reflect that.  To ensure these
are actually the same underlying InputStream, we now create our own
PacketLineIn wrapper around the supplied raw InputStream.  Its a
very low-cost object since it has only the 4 byte length buffer.

Instead of hardcoding the header length as 5, use the constant from
SideBandOutputStream.  This makes it a bit more clear what we are
consuming, exactly here.

Change-Id: Iebd05538042913536b88c3ddc3adc3a86a841cc5
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoRefactor SideBandOutputStream to be buffered 87/287/4
Shawn O. Pearce [Tue, 9 Feb 2010 03:10:50 +0000 (19:10 -0800)]
Refactor SideBandOutputStream to be buffered

Instead of relying on our callers to wrap us up inside of a
BufferedOutputStream and using the proper block sizing, do the
buffering directly inside of SideBandOutputStream.  This ensures
we don't get large write-throughs from BufferedOutputStream that
might overflow the configured packet size.

The constructor of SideBandOutputStream is also beefed up to check
its arguments and ensure they are within acceptable ranges for the
current side-band protocol.

Change-Id: Ic14567327d03c9e972f9734b8228178bc448867d
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoDon't doubly wrap TransportException in smart HTTP client 99/299/1
Shawn O. Pearce [Thu, 11 Feb 2010 19:39:09 +0000 (11:39 -0800)]
Don't doubly wrap TransportException in smart HTTP client

If the readAdvertisedRefs() method throws an exception, its already
closed the connection and wrapped the underlying cause inside of a
suitable TransportException object that it is throwing.  We shouldn't
catch IOException and rethrow a wrapped copy here, because we'll double
wrap the exception thrown by readAdvertisedRefs.  This may obsecure the
root cause of the connection failure from the end-user.

Change-Id: I0ca61560f9888c666323dac8a5582aab25e897ff
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoAdd a RefFilter interface to ReceivePack and UploadPack 80/280/5
Nico Sallembien [Tue, 9 Feb 2010 17:53:53 +0000 (09:53 -0800)]
Add a RefFilter interface to ReceivePack and UploadPack

When a user of ReceivePack or UploadPack wants to control what refs
are sent to the client, for instance when some refs should be hidden
from some clients, this interface can be extended to provide a fine
grained control over what refs are sent to the client.

Change-Id: Ie6320b0f8922e1a5e1bad91c016bd476ea094366

14 years agoRemove pointless boolean during native push 86/286/1
Shawn O. Pearce [Tue, 9 Feb 2010 23:58:37 +0000 (15:58 -0800)]
Remove pointless boolean during native push

The boolean field sentCommand is always true at this point, as it
was assigned just 5 lines above.  So we always set the status of
the update command object to AWAITING_REPORT.

Simplify the logic by dropping the ?: operator.  I assume this is
older code from an attempt to manage dry-run push support within
the native connection, but in fact dry-run support is done higher
up inside of PushProcess.

Change-Id: I450d491bbbb5afecdbf5444ab7169222e856a3bb
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agohttp.test: Use JUnit 3 test runner 85/285/1
Shawn O. Pearce [Wed, 10 Feb 2010 03:34:04 +0000 (19:34 -0800)]
http.test: Use JUnit 3 test runner

JGit relies on JUnit 3, not JUnit 4.

Change-Id: Ic5a0ae1564d7744c203321857fc603e7008dbf13
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agohttp.test: Add missing plugin.properties to build 84/284/1
Shawn O. Pearce [Wed, 10 Feb 2010 03:19:49 +0000 (19:19 -0800)]
http.test: Add missing plugin.properties to build

Change-Id: I17e2c22498092d25dace88319698626ce55df822

14 years agohttp.test: Use JGit Format and compiler settings 83/283/1
Shawn O. Pearce [Wed, 10 Feb 2010 03:19:29 +0000 (19:19 -0800)]
http.test: Use JGit Format and compiler settings

Somehow we missed setting this up for the project.

Change-Id: Id55a6415f5fd03a7cd9d4d4ecbdd726cef79430d
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoUpdate build to use Tycho 0.7.0 78/278/1
Matthias Sohn [Mon, 8 Feb 2010 16:16:54 +0000 (17:16 +0100)]
Update build to use Tycho 0.7.0

Change-Id: Ie4133083a1cb1730f3dba52c0b8d359c7ed845e6
Signed-off-by: Matthias Sohn <matthias.sohn@sap.com>
14 years agoIntermediate workaround for JGit's lack of core.autocrlf support 74/274/1
Robin Rosenberg [Thu, 4 Feb 2010 06:17:18 +0000 (07:17 +0100)]
Intermediate workaround for JGit's lack of core.autocrlf support

Windows users by default have core.autocrlf set to true. JGit
does not recognize the flags and thus works as if it is set. In order
to make JGit more compatible with msysgit we set the flag to false
in repositories that JGit creates.

Bug: 301775
Change-Id: I7ea462fe3516e5060b87aa1f7ed63689936830c2
Signed-off-by: Robin Rosenberg <robin.rosenberg@dewire.com>
14 years agoUse keep(1) instead of add() when skipping an entry 64/264/3
Shawn O. Pearce [Fri, 11 Sep 2009 19:35:23 +0000 (12:35 -0700)]
Use keep(1) instead of add() when skipping an entry

Doing a keep call with a length of 1 will copy the current entry just
like the previous add was doing, but it avoids doing any validation
on the entry.  This is sane because the entry can be assumed to be
already valid, since its originating from the destination index.

Change-Id: I250d902fc98580444af1ba4b8fedceb654541451
Originally: http://thread.gmane.org/gmane.comp.version-control.git/128214/focus=128213
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoDon't allow DirCacheEntry with mode of 0 63/263/3
Shawn O. Pearce [Fri, 11 Sep 2009 19:33:05 +0000 (12:33 -0700)]
Don't allow DirCacheEntry with mode of 0

A 0 file mode in a DirCacheEntry is not a valid mode.  To C git
such a value indicates the record should not be present.  We already
were catching this bad state and exceptioning out when writing tree
objects to disk, but we did not fail when writing the dircache back
to disk.  This allowed JGit applications to create a dircache file
which C git would not like to read.

Instead of checking the mode during writes, we now check during
mutation.  This allows application bugs to be detected sooner and
closer to the cause site.  It also allows us to avoid checking most
of the records which we read in from disk, as we can assume these
are formatted correctly.

Some of our unit tests were not setting the FileMode on their test
entry, so they had to be updated to use REGULAR_FILE.

Change-Id: Ie412053c390b737c0ece57b8e063e4355ee32437
Originally: http://thread.gmane.org/gmane.comp.version-control.git/128214/focus=128213
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
CC: Adam W. Hawks <awhawks@writeme.com>
14 years agoDisallow creating invalid DirCacheEntry records 62/262/2
Shawn O. Pearce [Fri, 11 Sep 2009 17:52:13 +0000 (10:52 -0700)]
Disallow creating invalid DirCacheEntry records

A dircache record must not use a path string like "/a" or "a//b"
as this results in a tree entry being written with a zero length
name component in the record.  C git does not support an empty name,
and neither does any modern filesystem.

A record also must not have a stage outside of the standard 0-3
value range, as there are only 2 bits of space available in the
on-disk format of the record to store the stage information.
Any other values would be truncated into this space, storing a
different value than the caller expected.

If an application tries to create a DirCache record with either of
these wrong values, we abort with an IllegalArgumentException.

Change-Id: I699de149efdfccd85d8adde07d3efd080e3b49c2
Originally: http://thread.gmane.org/gmane.comp.version-control.git/128214
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
CC: Adam W. Hawks <awhawks@writeme.com>
14 years agoMerge "Ensure RawText closes the FileInputStream when read is complete"
Robin Rosenberg [Wed, 3 Feb 2010 21:42:07 +0000 (16:42 -0500)]
Merge "Ensure RawText closes the FileInputStream when read is complete"

14 years agoAdding some Eclipse-related legal files to JGit 70/270/1
Chris Aniszczyk [Wed, 3 Feb 2010 21:18:06 +0000 (15:18 -0600)]
Adding some Eclipse-related legal files to JGit

14 years agoEnsure RawText closes the FileInputStream when read is complete 66/266/2
Shawn O. Pearce [Wed, 3 Feb 2010 16:23:34 +0000 (08:23 -0800)]
Ensure RawText closes the FileInputStream when read is complete

Rather than implementing the file reading logic ourselves, and
wind up leaking the FileInputStream's file descriptor until the
next GC, use IO.readFully(File) which wraps the read loop inside
of a try/finally to ensure the stream is closed before it exits.

Change-Id: I85a3fe87d5eff88fa788962004aebe19d2e91bb4
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
Reviewed-by: Roland Grunberg <rgrunber@redhat.com>
14 years agoCleanup OSGi Import-Package specifications to use versions 65/265/1
Shawn O. Pearce [Wed, 3 Feb 2010 04:03:03 +0000 (20:03 -0800)]
Cleanup OSGi Import-Package specifications to use versions

Actually set the range of versions we are willing to accept for
each package we import, lest we import something in the future
that isn't compatible with our needs.

Change-Id: I25dbbb9eaabe852631b677e0c608792b3ed97532
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoMicro-optimize CanonicalTreeParser next() for ObjectWalk 60/260/1
Shawn O. Pearce [Tue, 2 Feb 2010 22:21:27 +0000 (14:21 -0800)]
Micro-optimize CanonicalTreeParser next() for ObjectWalk

ObjectWalk is invoking next() for each record we consider in a tree.
Rather than doing several method calls against the current parser,
and testing if we are at eof() at least twice per next() invocation,
do it only once and inline the logic to move the parser forward.

Change-Id: If5938f5d7b3ca24f500a184c9bd2ef193015414e
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoFix ObjectWalk corruption when skipping over empty trees 59/259/1
Shawn O. Pearce [Tue, 2 Feb 2010 20:40:04 +0000 (12:40 -0800)]
Fix ObjectWalk corruption when skipping over empty trees

The supplied test case comes out of the example tree identified by
Robert de Wilde and Ilari on #git:

  $ git ls-tree -rt a54f1a85ebf6a7f53aa60a45a1be33f8b078fb7e
  040000 tree bfe058ad536cdb12e127cde63b01472c960ea105    A
  040000 tree 4b825dc642cb6eb9a060e54bf8d69288fbee4904    A/A
  040000 tree 4b825dc642cb6eb9a060e54bf8d69288fbee4904    A/B
  100644 blob abbbfafe3129f85747aba7bfac992af77134c607    B

In this tree, "B" was being skipped because "A/A" as an empty tree
was immediately followed by "A/B", also an empty tree, but the
ObjectWalk broke out too early and never visited "B".

Bug: 286653
Change-Id: I25bcb0bc99d0cbbbdd9c2bd625ad6a691a6d0335
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoEnsure the tree parser resets in ObjectWalk 58/258/1
Shawn O. Pearce [Tue, 2 Feb 2010 19:39:24 +0000 (11:39 -0800)]
Ensure the tree parser resets in ObjectWalk

During dispose() or reset() we are suppose to be restoring the
ObjectWalk instance back to the original pre-walk state, but we
failed to reset the tree parser.  This can lead to confusing state
if the ObjectWalk was reused by the caller, as entries from the
old walk might be reported as part of the new walk.

Change-Id: I6237bae7bfd3794e8b9a92b4dd475559cc72e634
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoCorrect ObjectWalk error message when bad object is found 57/257/1
Shawn O. Pearce [Tue, 2 Feb 2010 18:49:32 +0000 (10:49 -0800)]
Correct ObjectWalk error message when bad object is found

Instead of including "ObjectId[SHA-1]" in the message, just
us the formatted SHA-1 name of the object by calling name().

Change-Id: I0d1d0e8207f8a3f02188e60242e4e9bf7420e88f
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoCorrectly skip over unrecognized optional dircache extensions 56/256/1
Shawn O. Pearce [Tue, 2 Feb 2010 17:09:26 +0000 (09:09 -0800)]
Correctly skip over unrecognized optional dircache extensions

We didn't skip the correct number of bytes when we skipped over an
unrecognized but optional dircache extension.  We missed skipping
the 8 byte header that makes up the extension's name and length.

We also didn't include the skipped extension's payload as part of
our index checksum, resuting in a checksum failure when the index
was done reading.  So ensure we always scan through a skipped
section and include it in the checksum computation.

Add a test case for a currently unsupported index extension, 'ZZZZ',
to verify we can still read the DirCache object even though we
don't know what 'ZZZZ' is supposed to mean.

Bug: 301287
Change-Id: I4bdde94576fffe826d0782483fd98cab1ea628fa
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoRemove RepositoryTestCase from DirCacheCGitCompatabilityTest 55/255/1
Shawn O. Pearce [Tue, 2 Feb 2010 16:46:13 +0000 (08:46 -0800)]
Remove RepositoryTestCase from DirCacheCGitCompatabilityTest

This test doesn't actually depend upon the large data set we have
in the RepositoryTestCase, so drop that from the dependency and
use the more simple LocalDiskRepositoryTestCase instead.

Change-Id: I0fd4affe1dd5ec86e8c3253db42df11d3b612e36
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoFix .classpath to make jgit easily runnable from inside eclipse 54/254/1
Christian Halstrick [Tue, 2 Feb 2010 12:30:48 +0000 (13:30 +0100)]
Fix .classpath to make jgit easily runnable from inside eclipse

When running jgit from inside Eclipse (e.g. rightclick on project
org.eclipse.jgit.pgm and select Run as->Java application) no commands
are found. This is because the commands are loaded from a resource file
/META-INF/services/org.eclipse.jgit.pgm.TextBuiltin and this file is
not anymore on the classpath.
I fixed this by modifying .classpath to contain the META-INF directory.

Signed-off-by: Christian Halstrick <christian.halstrick@sap.com>
14 years agoFix server side NPE during push to empty repository 52/252/1
Shawn O. Pearce [Mon, 1 Feb 2010 08:51:28 +0000 (00:51 -0800)]
Fix server side NPE during push to empty repository

If the repository is empty, we have no HEAD branch, which means we
can't test to see if the HEAD is detached and should be advertised
as a .have line.

Change-Id: I6e85f836e7db057cede812d0d6c1aecbd6cbe6c5
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoMerge "Generate an Eclipse IP log with jgit eclipse-iplog"
Shawn Pearce [Fri, 29 Jan 2010 18:48:17 +0000 (13:48 -0500)]
Merge "Generate an Eclipse IP log with jgit eclipse-iplog"

14 years agoMerge "Check for remote server exec failures and report"
Shawn Pearce [Fri, 29 Jan 2010 18:45:17 +0000 (13:45 -0500)]
Merge "Check for remote server exec failures and report"

14 years agoGenerate an Eclipse IP log with jgit eclipse-iplog 44/244/6
Shawn O. Pearce [Thu, 28 Jan 2010 19:13:11 +0000 (11:13 -0800)]
Generate an Eclipse IP log with jgit eclipse-iplog

The new plugin contains the bulk of the logic to scan a Git repository,
and query IPZilla, in order to produce an XML formatted IP log for the
requested revision of any Git based project.  This plugin is suitable
for embedding into a servlet container, or into the Eclipse workbench.

The command line pgm package knows how to invoke this plugin through
the eclipse-iplog subcommand, permitting storage of the resulting
log as a local XML file.

Change-Id: If01d9d98d07096db6980292bd5f91618c55d00be
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoMerge "Add unsetSection to Config to remove an entire block"
Robin Rosenberg [Fri, 29 Jan 2010 04:49:38 +0000 (23:49 -0500)]
Merge "Add unsetSection to Config to remove an entire block"

14 years agoAdd unsetSection to Config to remove an entire block 50/250/2
Shawn O. Pearce [Thu, 28 Jan 2010 19:10:52 +0000 (11:10 -0800)]
Add unsetSection to Config to remove an entire block

The unsetSection method can be used to delete an entire configuration
block, such as a [branch ""] or [remote ""] section in a file.

Change-Id: I93390c9b2187eb1b0d51353518feaed83bed2aad
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
Signed-off-by: Robin Rosenberg <robin.rosenberg@dewire.com>
14 years agoMerge "Relax ObjectChecker to permit missing tagger lines"
Robin Rosenberg [Fri, 29 Jan 2010 04:43:40 +0000 (23:43 -0500)]
Merge "Relax ObjectChecker to permit missing tagger lines"

14 years agoMerge "Update the update site URL and corresponding feature.properties."
Matthias Sohn [Thu, 28 Jan 2010 00:37:46 +0000 (19:37 -0500)]
Merge "Update the update site URL and corresponding feature.properties."

14 years agoMerge "Added caching for loose object lookup during pack indexing"
Shawn Pearce [Wed, 27 Jan 2010 22:04:50 +0000 (17:04 -0500)]
Merge "Added caching for loose object lookup during pack indexing"

14 years agoUpdate the update site URL and corresponding feature.properties. 49/249/1
Matthias Sohn [Wed, 27 Jan 2010 17:18:12 +0000 (18:18 +0100)]
Update the update site URL and corresponding feature.properties.

Change-Id: I55b42bca435c538a8c5534c68813568a2188b55b
Signed-off-by: Matthias Sohn <matthias.sohn@sap.com>
14 years agoFix racy HTTP tests by waiting for requests to finish 43/243/1
Shawn O. Pearce [Mon, 25 Jan 2010 22:51:56 +0000 (14:51 -0800)]
Fix racy HTTP tests by waiting for requests to finish

Ensure the background Jetty threads have been able to write the
request log record before the JUnit thread tries to read the set
of requests back.  This wait is necessary because the JUnit thread
may be able to continue as soon as Jetty has finished writing
the response onto the socket, and hasn't necessarily finished the
post-response logging activity.

By using a semaphore with a fixed number of resources, and using
one resource per request, but all of them when we want to read the
log, we implement a simple lock that requires there be no active
requests when we want to get the log from the JUnit thread.

Change-Id: I499e1c96418557185d0e19ba8befe892f26ce7e4
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoMerge "Don't confuse empty configuration variables with booleans"
Shawn Pearce [Mon, 25 Jan 2010 15:26:22 +0000 (10:26 -0500)]
Merge "Don't confuse empty configuration variables with booleans"

14 years agoDon't confuse empty configuration variables with booleans 42/242/1
Shawn O. Pearce [Sun, 24 Jan 2010 01:17:23 +0000 (17:17 -0800)]
Don't confuse empty configuration variables with booleans

Config was confusing the following two variables when writing the
file back to text format:

  [my]
    empty =
    enabled

When parsed, we say that my.empty has 1 value, null, and my.enabled
is an empty string value that in boolean context should be evaluated
as true.

Saving this configuration file back to text format was ignoring the
null value for my.empty, producing a completely different file than
what Config read:

  [my]
    empty
    enabled

Instead handle the writing differently to ensure the original format
is output.  New tests cases cover the expected behavior and return
values from accessor methods.

Change-Id: Id37379ce20cb27e3330923cf989444dd9f2bdd96
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoDisable the JRE HTTP cache, if any 41/241/1
Shawn O. Pearce [Sat, 23 Jan 2010 21:42:56 +0000 (13:42 -0800)]
Disable the JRE HTTP cache, if any

We don't want to use the JRE cache when fetching content.

Change-Id: Id76f3e618967c98ed4fbc47a1a2a9e77acbe41ab
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoCheck for remote server exec failures and report 40/240/1
Shawn O. Pearce [Sat, 23 Jan 2010 21:11:58 +0000 (13:11 -0800)]
Check for remote server exec failures and report

If remote.name.uploadpack or .receivepack is misconfigured and points
to a non-existent command on the remote system, we should receive back
exit status 127.  Report this case specially with the command we used
so the user knows what is going.

Bug: 293703
Change-Id: I7504e7b6238d5d8e698d37db7411c4817a039d08
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoRelax ObjectChecker to permit missing tagger lines 39/239/1
Shawn O. Pearce [Sat, 23 Jan 2010 20:11:38 +0000 (12:11 -0800)]
Relax ObjectChecker to permit missing tagger lines

Annotated tags created with C Git versions before the introduction
of c818566 ([PATCH] Update tags to record who made them, 2005-07-14),
do not have a "tagger" line present in the object header.  This line
did not appear in C Git until v0.99.1~9.

Ancient projects such as the Linux kernel contain such tags, for
example Linux 2.6.12 is older than when this feature first appeared
in C Git.  Linux v2.6.13-rc4 in late July 2005 is the first kernel
version tag to actually contain a tagger line.

It is therefore acceptable for the header to be missing, and for
the RevTag.getTaggerIdent() method to return null.

Since the Javadoc for getTaggerIdent() already explained that the
identity may be null, we just need to test that this is true when
the header is missing, and allow the ObjectChecker to pass anyway.

Change-Id: I34ba82e0624a0d1a7edcf62ffba72260af6f7e5d
See: http://code.google.com/p/gerrit/issues/detail?id=399
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoCorrect bundle, provider names to be consistent 38/238/1
Shawn O. Pearce [Sat, 23 Jan 2010 19:40:31 +0000 (11:40 -0800)]
Correct bundle, provider names to be consistent

Technically our project name is "JGit", not "Java Git".  In fact
there is already another project called "JavaGit" (no space) that we
don't want to become confused with.  Ensure we always call ourselves
"JGit" in user visible assets, like the bundle name.

Other Eclipse products list their provider as "Eclipse.org",
not "eclipse.org".  So list ourselves that way in all of our
plugin.properties files.

Change-Id: Ibcea1cd6dda2af757a8584099619fc23b7779a84
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoCorrect indentation in org.eclipse.jgit.packaging/pom.xml 37/237/1
Shawn O. Pearce [Sat, 23 Jan 2010 19:36:46 +0000 (11:36 -0800)]
Correct indentation in org.eclipse.jgit.packaging/pom.xml

Change-Id: I45caafbad4daac827f661d38c7f719e9b5511dd4
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoMerge "Make HTTP test project work in Eclipse"
Shawn Pearce [Sat, 23 Jan 2010 19:30:45 +0000 (14:30 -0500)]
Merge "Make HTTP test project work in Eclipse"

14 years agoMake HTTP test project work in Eclipse 03/203/4
Robin Rosenberg [Sun, 17 Jan 2010 21:44:05 +0000 (22:44 +0100)]
Make HTTP test project work in Eclipse

The Jetty components are not available as part of Eclipse, but a
P2 packaged version can be found via [1] for Eclipse 3.5 and newer.

[1] http://wiki.eclipse.org/Jetty-OSGi_SDK

Change-Id: Ibd5930bb9fc9589125876ca50c52e58bd31b051c
Signed-off-by: Robin Rosenberg <robin.rosenberg@dewire.com>
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoMerge branch 'ref-abstract' 36/236/2
Shawn O. Pearce [Sat, 23 Jan 2010 19:11:06 +0000 (11:11 -0800)]
Merge branch 'ref-abstract'

* ref-abstract:
  Optimize RefAdvertiser performance by avoiding sorting
  branch: Add -m option to rename a branch
  Replace writeSymref with RefUpdate.link
  Rewrite reference handling to be abstract and accurate
  Create new RefList and RefMap utility types

Change-Id: If43aacf5aa4013edbd0a6e84d84c4f9e94de5be0

14 years agoOptimize RefAdvertiser performance by avoiding sorting 34/234/3
Shawn O. Pearce [Sat, 23 Jan 2010 02:42:12 +0000 (18:42 -0800)]
Optimize RefAdvertiser performance by avoiding sorting

Don't copy and sort the set of references if they are passed through
in a RefMap or a SortedMap using the key's natural sort ordering.
Either map is already in the order we want to present the items
to the client in, so copying and sorting is a waste of local CPU
and memory.

Change-Id: I49ada7c1220e0fc2a163b9752c2b77525d9c82c1
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agobranch: Add -m option to rename a branch 96/196/6
Shawn O. Pearce [Sun, 10 Jan 2010 03:22:47 +0000 (19:22 -0800)]
branch: Add -m option to rename a branch

Change-Id: I7cf8e43344eaf301592fba0c178e04daad930f9a
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoReplace writeSymref with RefUpdate.link 95/195/6
Shawn O. Pearce [Sun, 10 Jan 2010 02:56:45 +0000 (18:56 -0800)]
Replace writeSymref with RefUpdate.link

By using RefUpdate for symbolic reference creation we can reuse
the logic related to updating the reflog with the event, without
needing to expose something such as the legacy ReflogWriter class
(which we no longer have).

Applications using writeSymref must update their code to use the
new pattern of changing the reference through the updateRef method:

    String refName = "refs/heads/master";
    RefUpdate u = repository.updateRef(Constants.HEAD);
    u.setRefLogMessage("checkout: moving to " + refName, false);
    switch (u.link(refName)) {
    case NEW:
    case FORCED:
    case NO_CHANGE:
        // A successful update of the reference
        break;
    default:
        // Handle the failure, e.g. for older behavior
        throw new IOException(u.getResult());
    }

Change-Id: I1093e1ec2970147978a786cfdd0a75d0aebf8010
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoRewrite reference handling to be abstract and accurate 94/194/5
Shawn O. Pearce [Fri, 22 Jan 2010 22:54:40 +0000 (14:54 -0800)]
Rewrite reference handling to be abstract and accurate

This commit actually does three major changes to the way references
are handled within JGit.  Unfortunately they were easier to do as
a single massive commit than to break them up into smaller units.

Disambiguate symbolic references:
---------------------------------

  Reporting a symbolic reference such as HEAD as though it were
  any other normal reference like refs/heads/master causes subtle
  programming errors.  We have been bitten by this error on several
  occasions, as have some downstream applications written by myself.

  Instead of reporting HEAD as a reference whose name differs from
  its "original name", report it as an actual SymbolicRef object
  that the application can test the type and examine the target of.

  With this change, Ref is now an abstract type with different
  subclasses for the different types.

  In the classical example of "HEAD" being a symbolic reference to
  branch "refs/heads/master", the Repository.getAllRefs() method
  will now return:

      Map<String, Ref> all = repository.getAllRefs();
      SymbolicRef HEAD = (SymbolicRef) all.get("HEAD");
      ObjectIdRef master = (ObjectIdRef) all.get("refs/heads/master");

      assertSame(master,               HEAD.getTarget());
      assertSame(master.getObjectId(), HEAD.getObjectId());

      assertEquals("HEAD",              HEAD.getName());
      assertEquals("refs/heads/master", master.getName());

  A nice side-effect of this change is the storage type of the
  symbolic reference is no longer ambiguous with the storge type
  of the underlying reference it targets.  In the above example,
  if master was only available in the packed-refs file, then the
  following is also true:

      assertSame(Ref.Storage.LOOSE,  HEAD.getStorage());
      assertSame(Ref.Storage.PACKED, master.getStorage());

  (Prior to this change we returned the ambiguous storage of
   LOOSE_PACKED for HEAD, which was confusing since it wasn't
   actually true on disk).

  Another nice side-effect of this change is all intermediate
  symbolic references are preserved, and are therefore visible
  to the application when they walk the target chain.  We can
  now correctly inspect chains of symbolic references.

  As a result of this change the Ref.getOrigName() method has been
  removed from the API.  Applications should identify a symbolic
  reference by testing for isSymbolic() and not by using an arcane
  string comparsion between properties.

Abstract the RefDatabase storage:
---------------------------------

  RefDatabase is now abstract, similar to ObjectDatabase, and a
  new concrete implementation called RefDirectory is used for the
  traditional on-disk storage layout.  In the future we plan to
  support additional implementations, such as a pure in-memory
  RefDatabase for unit testing purposes.

Optimize RefDirectory:
----------------------

  The implementation of the in-memory reference cache, reading, and
  update routines has been completely rewritten.  Much of the code
  was heavily borrowed or cribbed from the prior implementation,
  so copyright notices have been left intact as much as possible.

  The RefDirectory cache no longer confuses symbolic references
  with normal references.  This permits the cache to resolve the
  value of a symbolic reference as late as possible, ensuring it
  is always current, without needing to maintain reverse pointers.

  The cache is now 2 sorted RefLists, rather than 3 HashMaps.
  Using sorted lists allows the implementation to reduce the
  in-memory footprint when storing many refs.  Using specialized
  types for the elements allows the code to avoid additional map
  lookups for auxiliary stat information.

  To improve scan time during getRefs(), the lists are returned via
  a copy-on-write contract.  Most callers of getRefs() do not modify
  the returned collections, so the copy-on-write semantics improves
  access on repositories with a large number of packed references.

  Iterator traversals of the returned Map<String,Ref> are performed
  using a simple merge-join of the two cache lists, ensuring we can
  perform the entire traversal in linear time as a function of the
  number of references: O(PackedRefs + LooseRefs).

  Scans of the loose reference space to update the cache run in
  O(LooseRefs log LooseRefs) time, as the directory contents
  are sorted before being merged against the in-memory cache.
  Since the majority of stable references are kept packed, there
  typically are only a handful of reference names to be sorted,
  so the sorting cost should not be very high.

  Locking is reduced during getRefs() by taking advantage of the
  copy-on-write semantics of the improved cache data structure.
  This permits concurrent readers to pull back references without
  blocking each other.  If there is contention updating the cache
  during a scan, one or more updates are simply skipped and will
  get picked up again in a future scan.

  Writing to the $GIT_DIR/packed-refs during reference delete is
  now fully atomic.  The file is locked, reparsed fresh, and written
  back out if a change is necessary.  This avoids all race conditions
  with concurrent external updates of the packed-refs file.

  The RefLogWriter class has been fully folded into RefDirectory
  and is therefore deleted.  Maintaining the reference's log is
  the responsiblity of the database implementation, and not all
  implementations will use java.io for access.

  Future work still remains to be done to abstract the ReflogReader
  class away from local disk IO.

Change-Id: I26b9287c45a4b2d2be35ba2849daa316f5eec85d
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoUse build timestamp as OSGi version qualifier 32/232/3
Matthias Sohn [Sat, 23 Jan 2010 00:03:37 +0000 (01:03 +0100)]
Use build timestamp as OSGi version qualifier

Translate the version qualifier using maven-antrun-plugin since we want
manifest-first and currently cannot rely on Tycho for the JGit build.

Introduce property for Eclipse p2 repository to enable builds against
other Eclipse versions.

Change-Id: I62c4e77ae91fe17f56c5a5338d53828d4e225395
Signed-off-by: Matthias Sohn <matthias.sohn@sap.com>
14 years agoCreate new RefList and RefMap utility types 33/233/1
Shawn O. Pearce [Sat, 23 Jan 2010 00:27:03 +0000 (16:27 -0800)]
Create new RefList and RefMap utility types

These types can be used by RefDatabase implementations to manage
the collection.

A RefList stores items sorted by their name, and is an immutable
type using copy-on-write semantics to perform modifications to
the collection.  Binary search is used to locate an existing item
by name, or to locate the proper insertion position if an item does
not exist.

A RefMap can merge up to 3 RefList collections at once during its
entry iteration, allowing items in the resolved or loose RefList
to override items by the same name in the packed RefList.

The RefMap's goal is O(log N) lookup time, and O(N) iteration time,
which is suitable for returning from a RefDatabase.  By relying on
the immutable RefList we might be able to make map construction
nearly constant, making Repository.getAllRefs() an inexpensive
operation if the caches are current.  Since modification is not
common, changes require up to O(N + log N) time to copy the internal
list and collapse or expand the list's array.  As most changes
are made to the loose collection and not the packed collection,
in practice most changes would require less than the full O(N)
time, due to a significantly smaller N in the loose list.

Almost complete test coverage is included in the corresponding
unit tests.  A handful of methods on RefMap are not tested in this
change, as writing the proper test depends on a future refactoring
of how the Ref class represents symbolic reference names.

Change-Id: Ic2095274000336556f719edd75a5c5dd6dd1d857
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoAdded caching for loose object lookup during pack indexing 28/228/2
Constantine Plotnikov [Thu, 21 Jan 2010 18:06:54 +0000 (21:06 +0300)]
Added caching for loose object lookup during pack indexing

On Windows systems, file system lookup is a slow operation, so
checking each object if it exists during indexing (after receiving
the pack) could take a siginificant time. This patch introduces
CachedObjectDirectory that pre-caches lookup results.

Bug: 300397
Change-Id: I471b93f9bb3ee173eb37cae1d75e9e4eb49985e7
Signed-off-by: Constantine Plotnikov <constantine.plotnikov@gmail.com>
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoMerge "Adding PDE API Tools nature to JGit"
Robin Rosenberg [Sun, 17 Jan 2010 15:30:52 +0000 (10:30 -0500)]
Merge "Adding PDE API Tools nature to JGit"

14 years agoAdding PDE API Tools nature to JGit 14/214/1
Chris Aniszczyk [Sat, 16 Jan 2010 16:00:30 +0000 (10:00 -0600)]
Adding PDE API Tools nature to JGit

14 years agoRemove redundant Maven plugin declarations from sub-modules 13/213/1
Matthias Sohn [Sat, 16 Jan 2010 01:23:28 +0000 (02:23 +0100)]
Remove redundant Maven plugin declarations from sub-modules

Change-Id: I2aa1b2e2e08108deec051594ca8ac3992e271f0f
Signed-off-by: Matthias Sohn <matthias.sohn@sap.com>
14 years agoMerge changes Icfe92059,I65a9da89
Shawn Pearce [Fri, 15 Jan 2010 15:34:01 +0000 (10:34 -0500)]
Merge changes Icfe92059,I65a9da89

* changes:
  Introduce a named constant for the ".git" directory extension
  Introduce a named constant for the .git directory.

14 years agoIntroduce a named constant for the ".git" directory extension 11/211/2
Robin Rosenberg [Thu, 14 Jan 2010 23:18:11 +0000 (00:18 +0100)]
Introduce a named constant for the ".git" directory extension

Change-Id: Icfe9205994c6810fcd880054a586e9eef29df9a1
Signed-off-by: Robin Rosenberg <robin.rosenberg@dewire.com>
14 years agoIntroduce a named constant for the .git directory. 10/210/2
Robin Rosenberg [Thu, 14 Jan 2010 22:53:11 +0000 (23:53 +0100)]
Introduce a named constant for the .git directory.

Not all occurrences of ".git" are replaced by this constant, only
those where it actually refers to the directory with that name, i.e
not the ".git" directory suffix.

Asserts and comment are also excluded from replacement.

Change-Id: I65a9da89aedd53817f2ea3eaab4f9c2bed35d7ee
Signed-off-by: Robin Rosenberg <robin.rosenberg@dewire.com>
14 years agoMaven 3/Tycho build for JGit feature 05/205/6
Matthias Sohn [Thu, 14 Jan 2010 00:22:42 +0000 (01:22 +0100)]
Maven 3/Tycho build for JGit feature

As discussed on the jgit-dev list here:
http://dev.eclipse.org/mhonarc/lists/egit-dev/msg00654.html

- Define a separate JGit feature.
- As of now create a separate JGit update site and zip it.

Change-Id: Ie4026f15f6250c4933dccf6f31b5009b90c036bc
Signed-off-by: Matthias Sohn <matthias.sohn@sap.com>
14 years agoAdd JUnit tests for HTTP transport 79/179/6
Shawn O. Pearce [Tue, 12 Jan 2010 20:30:42 +0000 (12:30 -0800)]
Add JUnit tests for HTTP transport

No Eclipse support for this project is provided, because the
Jetty project does not publish a complete P2 repository.

Change-Id: Ic5fe2e79bb216e36920fd4a70ec15dd6ccfd1468
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoDownload HEAD by itself if not in info/refs 78/178/6
Shawn O. Pearce [Mon, 4 Jan 2010 23:20:11 +0000 (15:20 -0800)]
Download HEAD by itself if not in info/refs

The dumb HTTP transport needs to download the HEAD ref and
resolve it manually if HEAD does not appear in info/refs.

Its typically for it to not be in the info/refs file.

Change-Id: Ie2a58fdfacfeee530b10edb433b8f98c85568585
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoclient side smart HTTP 50/50/11
Shawn O. Pearce [Wed, 6 Jan 2010 18:21:05 +0000 (10:21 -0800)]
client side smart HTTP

During fetch over http:// clients now try to take advantage of
the info/refs?service=git-upload-pack URL to determine if the
remote side will support a standard upload-pack command stream.
If so each block of 32 have lines is sent in one POST request,
prefixed by all of the 'want' lines and any previously discovered
common bases as 'have' lines.

During push over http:// clients now try to take advantage of
the info/refs?service=git-receive-pack URL to determine if the
remote side will support a standard receive-pack command stream.
If so, commands are sent along with their pack in a single HTTP
POST request.

Bug: 291002
Change-Id: I8c69b16ac15c442e1a4c3bd60b4ea1a47882b851
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoserver side: smart fetch over HTTP 49/49/10
Shawn O. Pearce [Wed, 6 Jan 2010 19:13:25 +0000 (11:13 -0800)]
server side: smart fetch over HTTP

Clients can request smart fetch support by examining the info/refs URL
with the service parameter set to the magic git-upload-pack string:

  GET /$GIT_DIR/info/refs?service=git-upload-pack HTTP/1.1

The response is formatted with the upload pack capabilities, using
the standard packet line formatter.  A special header line is put
in front of the standard upload-pack advertisement to let clients
know the service was recognized and is supported.

If the requested service is disabled an authorization status code is
returned, allowing the user agent to retry once they have obtained
credentials from a human, in case authentication is required by
the configured UploadPackFactory implementation.

Change-Id: Ib0f1a458c88b4b5509b0f882f55f83f5752bc57a
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoserver side: smart push over HTTP 46/46/11
Shawn O. Pearce [Wed, 6 Jan 2010 19:13:05 +0000 (11:13 -0800)]
server side: smart push over HTTP

Clients can request smart push support by examining the info/refs URL
with the service parameter set to the magic git-receive-pack string:

  GET /$GIT_DIR/info/refs?service=git-receive-pack HTTP/1.1

The response is formatted with the receive pack capabilities, using
the standard packet line formatter.  A special header block is put
in front of the standard receive-pack advertisement to let clients
know the service was recognized and is supported.

If the requested service is disabled an authorization status code is
returned, allowing the user agent to retry once they have obtained
credentials from a human, in case authentication is required by
the configured ReceivePackFactory implementation.

Change-Id: Ie4f6e0c7b68a68ec4b7cdd5072f91dd406210d4f
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoSimple dumb HTTP server for Git 41/41/12
Shawn O. Pearce [Wed, 6 Jan 2010 20:26:54 +0000 (12:26 -0800)]
Simple dumb HTTP server for Git

This is a simple HTTP server that provides the minimum server side
support required for dumb (non-git aware) transport clients.

We produce the info/refs and objects/info/packs file on the fly
from the local repository state, but otherwise serve data as raw
files from the on-disk structure.

In the future we could better optimize the FileSender class and the
servlets that use it to take advantage of direct file to network
APIs in more advanced servlet containers like Jetty.

Our glue package borrows the idea of a micro embedded DSL from
Google Guice and uses it to configure a collection of Filters
and HttpServlets, all of which are matched against requests using
regular expressions.  If a subgroup exists in the pattern, it is
extracted and used for the path info component of the request.

Change-Id: Ia0f1a425d07d035e344ae54faf8aeb04763e7487
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoExpose PacketLineOut for reuse outside of the transport package 45/45/9
Shawn O. Pearce [Wed, 7 Oct 2009 03:09:29 +0000 (20:09 -0700)]
Expose PacketLineOut for reuse outside of the transport package

Change-Id: Iaa331a476e28cf2880df5607de36bc9f67d041df
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoExpose RefAdvertiser for reuse outside of the transport package 44/44/9
Shawn O. Pearce [Wed, 7 Oct 2009 02:23:33 +0000 (19:23 -0700)]
Expose RefAdvertiser for reuse outside of the transport package

By making this class and its methods public, and the actual writing
abstract, we can reuse this code for other formats like writing an
info/refs file for HTTP transports.

Change-Id: Id0e349c30a0f5a8c1527e0e7383b80243819d9c5
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoTeach UploadPack how to use an RPC style interface 48/48/7
Shawn O. Pearce [Wed, 7 Oct 2009 07:10:51 +0000 (00:10 -0700)]
Teach UploadPack how to use an RPC style interface

If biDirectionalPipe is false UploadPack does not start out with
the advertisement but instead assumes it should read one block of
want/have lines, process that, and write the ACK/NAKs out.

This means it only is doing one read through the input followed by
one write to the output, which fits with the HTTP request processing
model, and any other type of RPC system.

Change-Id: Ia9f7c46ee556f996367180f15d2caa8572cdd59f
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoTeach ReceivePack how to use an RPC style interface 43/43/7
Shawn O. Pearce [Wed, 7 Oct 2009 01:43:41 +0000 (18:43 -0700)]
Teach ReceivePack how to use an RPC style interface

If biDirectionalPipe is false ReceivePack does not start out with the
advertisement but instead assumes it should read the command set once,
process that, and write the status report out.  This means it only is
doing one read through the input followed by one write to the output,
which fits with the HTTP request processing model, and any other type
of RPC system... assuming that the payload for input can be a very big
entity like the command stream followed by the pack file.

Change-Id: I6f31f6537a3b7498803a8a54e10b0622105718c1
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoRefactor TemporaryBuffer to support reuse in other contexts 52/152/5
Shawn O. Pearce [Fri, 27 Nov 2009 04:16:30 +0000 (20:16 -0800)]
Refactor TemporaryBuffer to support reuse in other contexts

Later we are going to add support for smart HTTP, which requires us to
buffer at least some of the request created by a client before we ship
it to the server.  For many requests, we can fit it completely into a
1 MiB buffer, but if it doesn't we can drop back to using the chunked
transfer encoding to send an unknown stream length.

Rather than recoding the block based memory buffer, we refactor the
local file overflow strategy into a subclass, allowing the HTTP client
code to replace this portion of the logic with its own approach to
start the chunked encoding request.

Change-Id: Iac61ea1017b14e0ad3c4425efc3d75718b71bb8e
Signed-off-by: Shawn O. Pearce <sop@google.com>
14 years agoImplement multi_ack_detailed protocol extension 51/151/5
Shawn O. Pearce [Wed, 4 Nov 2009 02:00:50 +0000 (18:00 -0800)]
Implement multi_ack_detailed protocol extension

The multi_ack_detailed extension breaks out the "ACK %s continue" status
code into "ACK %s common" and "ACK %s ready" states, making it easier to
discover which objects are truely common, and which objects are simply
on a chain the server doesn't care learning about.

Change-Id: Ie8e907424cfbbba84996ca205d49eacf339f9d04
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoAbstract out utility functions for creating test commits 76/176/3
Shawn O. Pearce [Tue, 5 Jan 2010 19:44:52 +0000 (11:44 -0800)]
Abstract out utility functions for creating test commits

These routines create a fairly clean DSL for writing out the
structure of a repository in a test case.  Abstract them into
a helper class that we can reuse in other test environments.

Change-Id: I55cce3d557e1a28afe2fdf37b3a5b67e2651c9f1
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoFix PersonIdent to always use SystemReader 83/183/2
Shawn O. Pearce [Wed, 6 Jan 2010 23:16:05 +0000 (15:16 -0800)]
Fix PersonIdent to always use SystemReader

Under unit tests we want the when and timezone to come from the
MockSystemReader and be stable.  We did this for the default
constructor based on the Repository, but failed to do it for the
name,emailAddress variant of the constructor.

Change-Id: I608ac7cf01673729303395e19b379b38fef136b3
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoFix RefWriter creation of info/refs to omit HEAD 75/175/3
Shawn O. Pearce [Mon, 4 Jan 2010 23:00:45 +0000 (15:00 -0800)]
Fix RefWriter creation of info/refs to omit HEAD

We really mean to omit HEAD here, but botched the difference between
getOrigName and getName on the Ref object.  We tested on the wrong
value, picking up the target of the symbolic ref and therefore
included it twice.

Change-Id: If780c65166ccada2e63a4f42bbab752a56b16564
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoMove TestRng to our JUnit helper package 77/177/3
Shawn O. Pearce [Wed, 6 Jan 2010 03:14:48 +0000 (19:14 -0800)]
Move TestRng to our JUnit helper package

Other test suites may find this useful, especially when trying
to defeat the pack file compression with random data files.

Change-Id: Ic00a4ac626af7a1c94d18ee99305e295b267b1a3
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoCorrect spelling error in StringUtils javadoc 85/185/5
Shawn O. Pearce [Thu, 7 Jan 2010 16:02:40 +0000 (08:02 -0800)]
Correct spelling error in StringUtils javadoc

Change-Id: Idd98530d5f6fca4de8631aa865e4bcd6e6cf9306
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoFinish removing Apache Felix maven-bundle-plugin 02/202/1
Shawn O. Pearce [Tue, 12 Jan 2010 19:41:35 +0000 (11:41 -0800)]
Finish removing Apache Felix maven-bundle-plugin

Since Robin reverted using the maven-bundle-plugin to produce the
OSGi manifest, there is no reason for us to reference it from our
build process anymore.

Also, when Robin reverted the to the Eclipse way of doing things,
we failed to update the ignore files to ignore our generated files
but not ignore our tracked .classpath.

Finally, we cannot delete the MANIFEST.MF file during a Maven build,
as this is once again a source file.

Change-Id: I53f77f2002cb4285f728968829560e835651e188
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoFix merge for "Partial revert "Switch build to Apache Felix maven-bundle-plugin"" 01/201/2
Robin Rosenberg [Tue, 12 Jan 2010 19:40:57 +0000 (20:40 +0100)]
Fix merge for "Partial revert "Switch build to Apache Felix maven-bundle-plugin""

There was a missing dependency.

Change-Id: Ib7b9f05ee4c7c2bd7760ce44a7c2cd72759d514d
Signed-off-by: Robin Rosenberg <robin.rosenberg@dewire.com>
14 years agoMerge "Partial revert "Switch build to Apache Felix maven-bundle-plugin""
Robin Rosenberg [Tue, 12 Jan 2010 19:35:17 +0000 (14:35 -0500)]
Merge "Partial revert "Switch build to Apache Felix maven-bundle-plugin""

14 years agoPartial revert "Switch build to Apache Felix maven-bundle-plugin" 00/200/1
Robin Rosenberg [Sun, 10 Jan 2010 12:46:33 +0000 (13:46 +0100)]
Partial revert "Switch build to Apache Felix maven-bundle-plugin"

This restores the ability to build using just Eclipse without
strange procedures, extra plugins and it is again possible to
work on both JGit and EGit in the same Eclipse workspace with
ease.

Change-Id: I0af08127d507fbce186f428f1cdeff280f0ddcda
Signed-off-by: Robin Rosenberg <robin.rosenberg@dewire.com>
14 years agoRead core.worktree regardless of whether .git was discovered or not 70/170/2
Robin Rosenberg [Sat, 2 Jan 2010 16:19:29 +0000 (17:19 +0100)]
Read core.worktree regardless of whether .git was discovered or not

The C Git documentation stated that the core.worktree config was
not read when the .git directory was found implicitly (from the
working directory).

This was not true, and had not been so for a long time. The
documentation has been updated to document the existing behaviour.

Change-Id: If1e81b6a981b9d70e849f24872f01c110e9bc950
Signed-off-by: Robin Rosenberg <robin.rosenberg@dewire.com>
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoExplicitly release resources used by java.util.zip.Deflater 84/184/2
Igor Fedorenko [Thu, 7 Jan 2010 02:18:44 +0000 (21:18 -0500)]
Explicitly release resources used by java.util.zip.Deflater

Deflater can use significant amount of native (i.e. C) heap
space. Failure to promptly release this memory results
in native memory leak in some cases, particularly severe for
VMs with large java max heap size. For example, running
Team->Commit in one of my EGit workspaces results in ~500M
java process size increase without any significant change
to amount of used java heap when JVM is started with -Xmx1024m.

Change-Id: I649679a8df5683ebedd9380d703513d31c625932
Signed-off-by: Igor Fedorenko <igor@ifedorenko.com>
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoUse build timestamp as OSGi version qualifier for SNAPSHOT builds 82/182/3
Igor Fedorenko [Wed, 6 Jan 2010 23:51:39 +0000 (18:51 -0500)]
Use build timestamp as OSGi version qualifier for SNAPSHOT builds

Default maven-bundle-plugin behaviour results in use of the same
.SNAPSHOT OSGi bundle version qualifier for all snapshot builds.
This causes problems for eclipse update manager and other consumers
that rely on OSGi bundle metadata to select "newer" or "best
matching" version of jgit bundle.

To solve the problem, maven-bundle-plugin is configured to replace
.SNAPSHOT with build timestamp in format like 20100106-1234.

Change-Id: I0999c7bd68aa2ee74dffaed54a8dc4e1b67cf80d
Signed-off-by: Igor Fedorenko <igor@ifedorenko.com>
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoRemove unnecessary semicolon in MergeChunk 81/181/1
Shawn O. Pearce [Wed, 6 Jan 2010 19:22:57 +0000 (11:22 -0800)]
Remove unnecessary semicolon in MergeChunk

Change-Id: I5526edca9816b90f5df2d7f14f24f11d3f5d2ead
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoMerge branch 'cq-diff' 80/180/1
Shawn O. Pearce [Wed, 6 Jan 2010 17:53:45 +0000 (09:53 -0800)]
Merge branch 'cq-diff'

Per CQ 3559 "JGit - Eugene Myers O(ND) difference algorithm" we
have approval to check this into our master branch.

* cq-diff:
  Add file content merge algorithm
  Add performance tests for MyersDiff
  Add javadoc comments, remove unused code, shift comments to correct place
  Fixed MyersDiff to be able to handle more than 100k
  Fix some warnings regarding unnecessary imports and accessing static methods
  Add the "jgit diff" command
  Prepare RawText for diff-index and diff-files
  Add a test class for Myers' diff algorithm
  Add Myers' algorithm to generate diff scripts
  Add set to IntList

Conflicts:
org.eclipse.jgit/src/org/eclipse/jgit/diff/RawText.java

Change-Id: Ia8e98d81ba1ab52f84d0258a40e6ef5eece9a5b1
CC: Christian Halstrick <christian.halstrick@sap.com>
14 years agoAdd file content merge algorithm 40/140/6
Christian Halstrick [Thu, 3 Dec 2009 15:36:14 +0000 (16:36 +0100)]
Add file content merge algorithm

Adds the file content merge alorithm and tests for merge to jgit.
The merge algorithm:

- Gets as input parameters the common base, the two new contents
  called "ours" and "theirs".

- Computes the Edits from base to ours and from base to theirs with
  the help of MyersDiff.

- Iterates over the edits.

- Independent edits from ours or from theirs will just be applied
  to the result.

- For conflicting edits we first harmonize the ranges of the edits
  so that in the end we have exactly two edits starting and ending
  at the same points in the common base. Then we write the two
  conclicting contents into the result stream.

Change-Id: I411862393e7bf416b6f33ca55ec5af608ff4663
Signed-off-by: Christian Halstrick <christian.halstrick@sap.com>
[sp: Fixed up two awkard comments in documentation.]
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoFix code formatter style references 74/174/1
Shawn O. Pearce [Tue, 5 Jan 2010 19:30:58 +0000 (11:30 -0800)]
Fix code formatter style references

We call it "JGit Format", not "JGit".

Change-Id: Idd20557d21fe20602c00a60bfeaea78d3c95fe5e
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>
14 years agoUnionInputStream: combines sequential InputStreams into one 53/153/3
Shawn O. Pearce [Sat, 28 Nov 2009 01:22:40 +0000 (17:22 -0800)]
UnionInputStream: combines sequential InputStreams into one

The UnionInputStream utility class combines multiple sequential
InputStreams so they appear to the caller as a single stream with
no gaps.  This can be used to concentate streams coming from multiple
independent HTTP connections (for example).

The companion unit test covers the class's full functionality.

Change-Id: I0676c7b5e082a5886bf0e8f43f9fd6c46a666228
Signed-off-by: Shawn O. Pearce <sop@google.com>
14 years agoAdd getPacks to ObjectDirectory 40/40/6
Shawn O. Pearce [Wed, 7 Oct 2009 01:21:03 +0000 (18:21 -0700)]
Add getPacks to ObjectDirectory

This exposes the list of known packs, allowing callers to list them
into a context like the objects/info/packs file.

Change-Id: I0b889564bd176836ff5c77ba310c6d229409dcd5
Signed-off-by: Shawn O. Pearce <spearce@spearce.org>