blockfilter_8cpp_source.html

// Copyright (c) 2018-2020 The Bitcoin Core developers

// Distributed under the MIT software license, see the accompanying

// file COPYING or http://www.opensource.org/licenses/mit-license.php.


#include <mutex>

#include <sstream>

#include <set>


#include <blockfilter.h>

#include <crypto/siphash.h>

#include <hash.h>

#include <primitives/transaction.h>

#include <script/script.h>

#include <streams.h>

#include <util/golombrice.h>


static constexpr int GCS_SER_TYPE = SER_NETWORK;


static constexpr int GCS_SER_VERSION = 0;


static const std::map<BlockFilterType, std::string> g_filter_types = {

    {BlockFilterType::BASIC, "basic"},

};


// Map a value x that is uniformly distributed in the range [0, 2^64) to a

// value uniformly distributed in [0, n) by returning the upper 64 bits of

// x * n.

//

// See: https://lemire.me/blog/2016/06/27/a-fast-alternative-to-the-modulo-reduction/

static uint64_t MapIntoRange(uint64_t x, uint64_t n)

{

#ifdef __SIZEOF_INT128__

    return (static_cast<unsigned __int128>(x) * static_cast<unsigned __int128>(n)) >> 64;

#else

    // To perform the calculation on 64-bit numbers without losing the

    // result to overflow, split the numbers into the most significant and

    // least significant 32 bits and perform multiplication piece-wise.

    //

    // See: https://stackoverflow.com/a/26855440

    uint64_t x_hi = x >> 32;

    uint64_t x_lo = x & 0xFFFFFFFF;

    uint64_t n_hi = n >> 32;

    uint64_t n_lo = n & 0xFFFFFFFF;


    uint64_t ac = x_hi * n_hi;

    uint64_t ad = x_hi * n_lo;

    uint64_t bc = x_lo * n_hi;

    uint64_t bd = x_lo * n_lo;


    uint64_t mid34 = (bd >> 32) + (bc & 0xFFFFFFFF) + (ad & 0xFFFFFFFF);

    uint64_t upper64 = ac + (bc >> 32) + (ad >> 32) + (mid34 >> 32);

    return upper64;

#endif

}


uint64_t GCSFilter::HashToRange(const Element& element) const

{

    uint64_t hash = CSipHasher(m_params.m_siphash_k0, m_params.m_siphash_k1)

        .Write(element.data(), element.size())

        .Finalize();

    return MapIntoRange(hash, m_F);

}


std::vector<uint64_t> GCSFilter::BuildHashedSet(const ElementSet& elements) const

{

    std::vector<uint64_t> hashed_elements;

    hashed_elements.reserve(elements.size());

    for (const Element& element : elements) {

        hashed_elements.push_back(HashToRange(element));

    }

    std::sort(hashed_elements.begin(), hashed_elements.end());

    return hashed_elements;

}


GCSFilter::GCSFilter(const Params& params)

    : m_params(params), m_N(0), m_F(0), m_encoded{0}

{}


GCSFilter::GCSFilter(const Params& params, std::vector<unsigned char> encoded_filter)

    : m_params(params), m_encoded(std::move(encoded_filter))

{

    VectorReader stream(GCS_SER_TYPE, GCS_SER_VERSION, m_encoded, 0);


    uint64_t N = ReadCompactSize(stream);

    m_N = static_cast<uint32_t>(N);

    if (m_N != N) {

        throw std::ios_base::failure("N must be <2^32");

    }

    m_F = static_cast<uint64_t>(m_N) * static_cast<uint64_t>(m_params.m_M);


    // Verify that the encoded filter contains exactly N elements. If it has too much or too little

    // data, a std::ios_base::failure exception will be raised.

    BitStreamReader<VectorReader> bitreader(stream);

    for (uint64_t i = 0; i < m_N; ++i) {

        GolombRiceDecode(bitreader, m_params.m_P);

    }

    if (!stream.empty()) {

        throw std::ios_base::failure("encoded_filter contains excess data");

    }

}


GCSFilter::GCSFilter(const Params& params, const ElementSet& elements)

    : m_params(params)

{

    size_t N = elements.size();

    m_N = static_cast<uint32_t>(N);

    if (m_N != N) {

        throw std::invalid_argument("N must be <2^32");

    }

    m_F = static_cast<uint64_t>(m_N) * static_cast<uint64_t>(m_params.m_M);


    CVectorWriter stream(GCS_SER_TYPE, GCS_SER_VERSION, m_encoded, 0);


    WriteCompactSize(stream, m_N);


    if (elements.empty()) {

        return;

    }


    BitStreamWriter<CVectorWriter> bitwriter(stream);


    uint64_t last_value = 0;

    for (uint64_t value : BuildHashedSet(elements)) {

        uint64_t delta = value - last_value;

        GolombRiceEncode(bitwriter, m_params.m_P, delta);

        last_value = value;

    }


    bitwriter.Flush();

}


bool GCSFilter::MatchInternal(const uint64_t* element_hashes, size_t size) const

{

    VectorReader stream(GCS_SER_TYPE, GCS_SER_VERSION, m_encoded, 0);


    // Seek forward by size of N

    uint64_t N = ReadCompactSize(stream);

    assert(N == m_N);


    BitStreamReader<VectorReader> bitreader(stream);


    uint64_t value = 0;

    size_t hashes_index = 0;

    for (uint32_t i = 0; i < m_N; ++i) {

        uint64_t delta = GolombRiceDecode(bitreader, m_params.m_P);

        value += delta;


        while (true) {

            if (hashes_index == size) {

                return false;

            } else if (element_hashes[hashes_index] == value) {

                return true;

            } else if (element_hashes[hashes_index] > value) {

                break;

            }


            hashes_index++;

        }

    }


    return false;

}


bool GCSFilter::Match(const Element& element) const

{

    uint64_t query = HashToRange(element);

    return MatchInternal(&query, 1);

}


bool GCSFilter::MatchAny(const ElementSet& elements) const

{

    const std::vector<uint64_t> queries = BuildHashedSet(elements);

    return MatchInternal(queries.data(), queries.size());

}


const std::string& BlockFilterTypeName(BlockFilterType filter_type)

{

    static std::string unknown_retval = "";

    auto it = g_filter_types.find(filter_type);

    return it != g_filter_types.end() ? it->second : unknown_retval;

}


bool BlockFilterTypeByName(const std::string& name, BlockFilterType& filter_type) {

    for (const auto& entry : g_filter_types) {

        if (entry.second == name) {

            filter_type = entry.first;

            return true;

        }

    }

    return false;

}


const std::set<BlockFilterType>& AllBlockFilterTypes()

{

    static std::set<BlockFilterType> types;


    static std::once_flag flag;

    std::call_once(flag, []() {

            for (auto entry : g_filter_types) {

                types.insert(entry.first);

            }

        });


    return types;

}


const std::string& ListBlockFilterTypes()

{

    static std::string type_list;


    static std::once_flag flag;

    std::call_once(flag, []() {

            std::stringstream ret;

            bool first = true;

            for (auto entry : g_filter_types) {

                if (!first) ret << ", ";

                ret << entry.second;

                first = false;

            }

            type_list = ret.str();

        });


    return type_list;

}


static GCSFilter::ElementSet BasicFilterElements(const CBlock& block,

                                                 const CBlockUndo& block_undo)

{

    GCSFilter::ElementSet elements;


    for (const CTransactionRef& tx : block.vtx) {

        for (const CTxOut& txout : tx->vout) {

            const CScript& script = txout.scriptPubKey;

            if (script.empty() || script[0] == OP_RETURN) continue;

            elements.emplace(script.begin(), script.end());

        }

    }


    for (const CTxUndo& tx_undo : block_undo.vtxundo) {

        for (const Coin& prevout : tx_undo.vprevout) {

            const CScript& script = prevout.out.scriptPubKey;

            if (script.empty()) continue;

            elements.emplace(script.begin(), script.end());

        }

    }


    return elements;

}


BlockFilter::BlockFilter(BlockFilterType filter_type, const uint256& block_hash,

                         std::vector<unsigned char> filter)

    : m_filter_type(filter_type), m_block_hash(block_hash)

{

    GCSFilter::Params params;

    if (!BuildParams(params)) {

        throw std::invalid_argument("unknown filter_type");

    }

    m_filter = GCSFilter(params, std::move(filter));

}


BlockFilter::BlockFilter(BlockFilterType filter_type, const CBlock& block, const CBlockUndo& block_undo)

    : m_filter_type(filter_type), m_block_hash(block.GetHash())

{

    GCSFilter::Params params;

    if (!BuildParams(params)) {

        throw std::invalid_argument("unknown filter_type");

    }

    m_filter = GCSFilter(params, BasicFilterElements(block, block_undo));

}


bool BlockFilter::BuildParams(GCSFilter::Params& params) const

{

    switch (m_filter_type) {

    case BlockFilterType::BASIC:

        params.m_siphash_k0 = m_block_hash.GetUint64(0);

        params.m_siphash_k1 = m_block_hash.GetUint64(1);

        params.m_P = BASIC_FILTER_P;

        params.m_M = BASIC_FILTER_M;

        return true;

    case BlockFilterType::INVALID:

        return false;

    }


    return false;

}


uint256 BlockFilter::GetHash() const

{

    const std::vector<unsigned char>& data = GetEncodedFilter();


    uint256 result;

    CHash256().Write(data).Finalize(result);

    return result;

}


uint256 BlockFilter::ComputeHeader(const uint256& prev_header) const

{

    const uint256& filter_hash = GetHash();


    uint256 result;

    CHash256()

        .Write(filter_hash)

        .Write(prev_header)

        .Finalize(result);

    return result;

}

g_filter_types
static const std::map< BlockFilterType, std::string > g_filter_types
Definition: blockfilter.cpp:23

GCS_SER_VERSION
static constexpr int GCS_SER_VERSION
Protocol version used to serialize parameters in GCS filter encoding.
Definition: blockfilter.cpp:21

BasicFilterElements
static GCSFilter::ElementSet BasicFilterElements(const CBlock &block, const CBlockUndo &block_undo)
Definition: blockfilter.cpp:228

BlockFilterTypeName
const std::string & BlockFilterTypeName(BlockFilterType filter_type)
Get the human-readable name for a filter type.
Definition: blockfilter.cpp:178

GCS_SER_TYPE
static constexpr int GCS_SER_TYPE
SerType used to serialize parameters in GCS filter encoding.
Definition: blockfilter.cpp:18

AllBlockFilterTypes
const std::set< BlockFilterType > & AllBlockFilterTypes()
Get a list of known filter types.
Definition: blockfilter.cpp:195

ListBlockFilterTypes
const std::string & ListBlockFilterTypes()
Get a comma-separated list of known filter type names.
Definition: blockfilter.cpp:209

BlockFilterTypeByName
bool BlockFilterTypeByName(const std::string &name, BlockFilterType &filter_type)
Find a filter type by its human-readable name.
Definition: blockfilter.cpp:185

MapIntoRange
static uint64_t MapIntoRange(uint64_t x, uint64_t n)
Definition: blockfilter.cpp:32

BlockFilterType
BlockFilterType
Definition: blockfilter.h:89

BlockFilterType::INVALID
@ INVALID

BlockFilterType::BASIC
@ BASIC

BASIC_FILTER_P
constexpr uint8_t BASIC_FILTER_P
Definition: blockfilter.h:85

BASIC_FILTER_M
constexpr uint32_t BASIC_FILTER_M
Definition: blockfilter.h:86

BitStreamReader
Definition: streams.h:458

BitStreamWriter
Definition: streams.h:501

BitStreamWriter::Flush
void Flush()
Flush any unwritten bits to the output stream, padding with 0's to the next byte boundary.
Definition: streams.h:545

BlockFilter::m_filter
GCSFilter m_filter
Definition: blockfilter.h:115

BlockFilter::BuildParams
bool BuildParams(GCSFilter::Params &params) const
Definition: blockfilter.cpp:273

BlockFilter::ComputeHeader
uint256 ComputeHeader(const uint256 &prev_header) const
Compute the filter header given the previous one.
Definition: blockfilter.cpp:298

BlockFilter::m_filter_type
BlockFilterType m_filter_type
Definition: blockfilter.h:113

BlockFilter::GetEncodedFilter
const std::vector< unsigned char > & GetEncodedFilter() const
Definition: blockfilter.h:134

BlockFilter::BlockFilter
BlockFilter()=default

BlockFilter::GetHash
uint256 GetHash() const
Compute the filter hash.
Definition: blockfilter.cpp:289

BlockFilter::m_block_hash
uint256 m_block_hash
Definition: blockfilter.h:114

CBlock
Definition: block.h:63

CBlock::vtx
std::vector< CTransactionRef > vtx
Definition: block.h:66

CBlockUndo
Undo information for a CBlock.
Definition: undo.h:64

CBlockUndo::vtxundo
std::vector< CTxUndo > vtxundo
Definition: undo.h:66

CHash256
A hasher class for Bitcoin's 256-bit hash (double SHA-256).
Definition: hash.h:24

CHash256::Finalize
void Finalize(Span< unsigned char > output)
Definition: hash.h:30

CHash256::Write
CHash256 & Write(Span< const unsigned char > input)
Definition: hash.h:37

CScript
Serialized script, used inside transaction inputs and outputs.
Definition: script.h:406

CSipHasher
SipHash-2-4.
Definition: siphash.h:14

CSipHasher::Finalize
uint64_t Finalize() const
Compute the 64-bit SipHash-2-4 of the data written so far.
Definition: siphash.cpp:76

CSipHasher::Write
CSipHasher & Write(uint64_t data)
Hash a 64-bit integer worth of data It is treated as if this was the little-endian interpretation of ...
Definition: siphash.cpp:28

CTxOut
An output of a transaction.
Definition: transaction.h:129

CTxOut::scriptPubKey
CScript scriptPubKey
Definition: transaction.h:132

CTxUndo
Undo information for a CTransaction.
Definition: undo.h:54

CTxUndo::vprevout
std::vector< Coin > vprevout
Definition: undo.h:57

CVectorWriter
Definition: streams.h:73

Coin
A UTXO entry.
Definition: coins.h:31

Coin::out
CTxOut out
unspent transaction output
Definition: coins.h:34

GCSFilter
This implements a Golomb-coded set as defined in BIP 158.
Definition: blockfilter.h:25

GCSFilter::Element
std::vector< unsigned char > Element
Definition: blockfilter.h:27

GCSFilter::m_F
uint64_t m_F
Range of element hashes, F = N * M.
Definition: blockfilter.h:45

GCSFilter::MatchInternal
bool MatchInternal(const uint64_t *sorted_element_hashes, size_t size) const
Helper method used to implement Match and MatchAny.
Definition: blockfilter.cpp:134

GCSFilter::ElementSet
std::unordered_set< Element, ByteVectorHash > ElementSet
Definition: blockfilter.h:28

GCSFilter::HashToRange
uint64_t HashToRange(const Element &element) const
Hash a data element to an integer in the range [0, N * M).
Definition: blockfilter.cpp:58

GCSFilter::m_N
uint32_t m_N
Number of elements in the filter.
Definition: blockfilter.h:44

GCSFilter::Match
bool Match(const Element &element) const
Checks if the element may be in the set.
Definition: blockfilter.cpp:166

GCSFilter::GCSFilter
GCSFilter(const Params &params=Params())
Constructs an empty filter.
Definition: blockfilter.cpp:77

GCSFilter::MatchAny
bool MatchAny(const ElementSet &elements) const
Checks if any of the given elements may be in the set.
Definition: blockfilter.cpp:172

GCSFilter::BuildHashedSet
std::vector< uint64_t > BuildHashedSet(const ElementSet &elements) const
Definition: blockfilter.cpp:66

GCSFilter::m_params
Params m_params
Definition: blockfilter.h:43

GCSFilter::m_encoded
std::vector< unsigned char > m_encoded
Definition: blockfilter.h:46

VectorReader
Minimal stream for reading from an existing vector by reference.
Definition: streams.h:134

VectorReader::empty
bool empty() const
Definition: streams.h:181

base_blob::GetUint64
uint64_t GetUint64(int pos) const
Definition: uint256.h:83

prevector::empty
bool empty() const
Definition: prevector.h:286

prevector::begin
iterator begin()
Definition: prevector.h:290

prevector::end
iterator end()
Definition: prevector.h:292

uint256
256-bit opaque blob.
Definition: uint256.h:124

golombrice.h

GolombRiceDecode
uint64_t GolombRiceDecode(BitStreamReader< IStream > &bitreader, uint8_t P)
Definition: golombrice.h:30

GolombRiceEncode
void GolombRiceEncode(BitStreamWriter< OStream > &bitwriter, uint8_t P, uint64_t x)
Definition: golombrice.h:13

transaction.h

CTransactionRef
std::shared_ptr< const CTransaction > CTransactionRef
Definition: transaction.h:386

name
const char * name
Definition: rest.cpp:43

script.h

OP_RETURN
@ OP_RETURN
Definition: script.h:104

hash.h

SER_NETWORK
@ SER_NETWORK
Definition: serialize.h:138

ReadCompactSize
uint64_t ReadCompactSize(Stream &is, bool range_check=true)
Decode a CompactSize-encoded variable-length integer.
Definition: serialize.h:282

WriteCompactSize
void WriteCompactSize(CSizeComputer &os, uint64_t nSize)
Definition: serialize.h:1074

siphash.h

streams.h

GCSFilter::Params
Definition: blockfilter.h:31

GCSFilter::Params::m_M
uint32_t m_M
Inverse false positive rate.
Definition: blockfilter.h:35

GCSFilter::Params::m_siphash_k1
uint64_t m_siphash_k1
Definition: blockfilter.h:33

GCSFilter::Params::m_P
uint8_t m_P
Golomb-Rice coding parameter.
Definition: blockfilter.h:34

GCSFilter::Params::m_siphash_k0
uint64_t m_siphash_k0
Definition: blockfilter.h:32

blockfilter.h

assert
assert(!tx.IsCoinBase())