trying huge pages
parent
fc611f3555
commit
20e41f34cc
|
@ -1,5 +1,5 @@
|
||||||
cmake_minimum_required(VERSION 3.25)
|
cmake_minimum_required(VERSION 3.25)
|
||||||
project(blt-gp VERSION 0.1.45)
|
project(blt-gp VERSION 0.1.46)
|
||||||
|
|
||||||
include(CTest)
|
include(CTest)
|
||||||
|
|
||||||
|
|
|
@ -25,6 +25,9 @@
|
||||||
#include <blt/gp/stats.h>
|
#include <blt/gp/stats.h>
|
||||||
#include <ostream>
|
#include <ostream>
|
||||||
#include <cstdlib>
|
#include <cstdlib>
|
||||||
|
#include <mutex>
|
||||||
|
#include <atomic>
|
||||||
|
#include <blt/std/mmap.h>
|
||||||
|
|
||||||
namespace blt::gp
|
namespace blt::gp
|
||||||
{
|
{
|
||||||
|
@ -113,6 +116,149 @@ namespace blt::gp
|
||||||
}
|
}
|
||||||
};
|
};
|
||||||
|
|
||||||
|
template<typename Alloc = blt::mmap_huge_allocator>
|
||||||
|
class variable_bump_allocator
|
||||||
|
{
|
||||||
|
public:
|
||||||
|
explicit variable_bump_allocator(blt::size_t default_block_size = BLT_2MB_SIZE): default_block_size(default_block_size)
|
||||||
|
{}
|
||||||
|
|
||||||
|
void* allocate(blt::size_t bytes)
|
||||||
|
{
|
||||||
|
#ifdef BLT_TRACK_ALLOCATIONS
|
||||||
|
tracker.allocate(bytes);
|
||||||
|
#endif
|
||||||
|
std::scoped_lock lock(mutex);
|
||||||
|
if (head == nullptr || head->remaining_bytes_in_block() < static_cast<blt::ptrdiff_t>(bytes))
|
||||||
|
{
|
||||||
|
push_block(bytes);
|
||||||
|
}
|
||||||
|
auto ptr = head->metadata.offset;
|
||||||
|
head->metadata.offset += bytes;
|
||||||
|
++head->metadata.allocated_objects;
|
||||||
|
return ptr;
|
||||||
|
}
|
||||||
|
|
||||||
|
void deallocate(void* ptr, blt::size_t bytes)
|
||||||
|
{
|
||||||
|
if (ptr == nullptr)
|
||||||
|
return;
|
||||||
|
#ifdef BLT_TRACK_ALLOCATIONS
|
||||||
|
tracker.deallocate(bytes);
|
||||||
|
#else
|
||||||
|
(void) bytes;
|
||||||
|
#endif
|
||||||
|
std::scoped_lock lock(mutex);
|
||||||
|
auto blk = to_block(ptr);
|
||||||
|
--blk->metadata.allocated_objects;
|
||||||
|
if (blk->metadata.allocated_objects == 0)
|
||||||
|
{
|
||||||
|
if (head == blk)
|
||||||
|
head = head->metadata.next;
|
||||||
|
else
|
||||||
|
{
|
||||||
|
auto prev = head;
|
||||||
|
auto next = head->metadata.next;
|
||||||
|
while (next != blk)
|
||||||
|
{
|
||||||
|
prev = next;
|
||||||
|
next = next->metadata.next;
|
||||||
|
}
|
||||||
|
prev->metadata.next = next->metadata.next;
|
||||||
|
}
|
||||||
|
deallocated_blocks.push_back(blk);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
~variable_bump_allocator()
|
||||||
|
{
|
||||||
|
std::scoped_lock lock(mutex);
|
||||||
|
for (auto* blk : deallocated_blocks)
|
||||||
|
alloc.deallocate(blk, blk->metadata.size);
|
||||||
|
auto cur = head;
|
||||||
|
while (cur != nullptr)
|
||||||
|
{
|
||||||
|
auto* ptr = cur;
|
||||||
|
cur = cur->metadata.next;
|
||||||
|
alloc.deallocate(ptr, ptr->metadata.size);
|
||||||
|
}
|
||||||
|
head = nullptr;
|
||||||
|
}
|
||||||
|
|
||||||
|
private:
|
||||||
|
struct block_t
|
||||||
|
{
|
||||||
|
struct block_metadata_t
|
||||||
|
{
|
||||||
|
blt::size_t size = 0;
|
||||||
|
blt::size_t allocated_objects = 0;
|
||||||
|
block_t* next = nullptr;
|
||||||
|
blt::u8* offset = nullptr;
|
||||||
|
} metadata;
|
||||||
|
blt::u8 buffer[8]{};
|
||||||
|
|
||||||
|
explicit block_t(blt::size_t size)
|
||||||
|
{
|
||||||
|
metadata.size = size;
|
||||||
|
reset();
|
||||||
|
}
|
||||||
|
|
||||||
|
void reset()
|
||||||
|
{
|
||||||
|
metadata.offset = buffer;
|
||||||
|
}
|
||||||
|
|
||||||
|
[[nodiscard]] blt::ptrdiff_t storage_size() const noexcept
|
||||||
|
{
|
||||||
|
return static_cast<blt::ptrdiff_t>(metadata.size - sizeof(typename block_t::block_metadata_t));
|
||||||
|
}
|
||||||
|
|
||||||
|
[[nodiscard]] blt::ptrdiff_t used_bytes_in_block() const noexcept
|
||||||
|
{
|
||||||
|
return static_cast<blt::ptrdiff_t>(metadata.offset - buffer);
|
||||||
|
}
|
||||||
|
|
||||||
|
[[nodiscard]] blt::ptrdiff_t remaining_bytes_in_block() const noexcept
|
||||||
|
{
|
||||||
|
return storage_size() - used_bytes_in_block();
|
||||||
|
}
|
||||||
|
};
|
||||||
|
|
||||||
|
static inline block_t* to_block(void* p)
|
||||||
|
{
|
||||||
|
return reinterpret_cast<block_t*>(reinterpret_cast<std::uintptr_t>(p) & static_cast<std::uintptr_t>(~(BLT_2MB_SIZE - 1)));
|
||||||
|
}
|
||||||
|
|
||||||
|
void push_block(blt::size_t bytes)
|
||||||
|
{
|
||||||
|
auto blk = allocate_block(bytes);
|
||||||
|
blk->metadata.next = head;
|
||||||
|
head = blk;
|
||||||
|
}
|
||||||
|
|
||||||
|
inline block_t* allocate_block(blt::size_t bytes)
|
||||||
|
{
|
||||||
|
if (!deallocated_blocks.empty())
|
||||||
|
{
|
||||||
|
auto blk = deallocated_blocks.back();
|
||||||
|
blk->reset();
|
||||||
|
deallocated_blocks.pop_back();
|
||||||
|
return blk;
|
||||||
|
}
|
||||||
|
auto size = align_size_to(bytes + sizeof(typename block_t::block_metadata_t), default_block_size);
|
||||||
|
auto* ptr = static_cast<block_t*>(alloc.allocate(size, blt::huge_page_t::BLT_2MB_PAGE));
|
||||||
|
new(ptr) block_t{size};
|
||||||
|
return ptr;
|
||||||
|
}
|
||||||
|
|
||||||
|
private:
|
||||||
|
block_t* head = nullptr;
|
||||||
|
std::mutex mutex;
|
||||||
|
std::vector<block_t*> deallocated_blocks;
|
||||||
|
Alloc alloc;
|
||||||
|
blt::size_t default_block_size;
|
||||||
|
};
|
||||||
|
|
||||||
template<typename T>
|
template<typename T>
|
||||||
class tracked_allocator_t
|
class tracked_allocator_t
|
||||||
{
|
{
|
||||||
|
|
|
@ -49,7 +49,7 @@ namespace blt::gp
|
||||||
constexpr static blt::size_t MAX_ALIGNMENT = 8;
|
constexpr static blt::size_t MAX_ALIGNMENT = 8;
|
||||||
template<typename T>
|
template<typename T>
|
||||||
using NO_REF_T = std::remove_cv_t<std::remove_reference_t<T>>;
|
using NO_REF_T = std::remove_cv_t<std::remove_reference_t<T>>;
|
||||||
using Allocator = aligned_allocator;
|
using Allocator = variable_bump_allocator<>;
|
||||||
public:
|
public:
|
||||||
static Allocator& get_allocator();
|
static Allocator& get_allocator();
|
||||||
|
|
||||||
|
|
|
@ -52,7 +52,7 @@ namespace blt::gp
|
||||||
|
|
||||||
stack_allocator::Allocator& stack_allocator::get_allocator()
|
stack_allocator::Allocator& stack_allocator::get_allocator()
|
||||||
{
|
{
|
||||||
thread_local static Allocator allocator;
|
static Allocator allocator;
|
||||||
return allocator;
|
return allocator;
|
||||||
}
|
}
|
||||||
|
|
||||||
|
|
Loading…
Reference in New Issue