Releases: wanghenshui/cppweeklynews
C++ 中文周刊 2025-01-25 第176期
公众号
点击「查看原文」跳转到 GitHub 上对应文件,链接就可以点击了
qq群 点击进入 满了加这个 729240657
欢迎投稿,推荐或自荐文章/软件/资源等,评论区留言
资讯
标准委员会动态/ide/编译器信息放在这里 一月邮件
安全问题还在吵架
编译器信息最新动态推荐关注hellogcc公众号 本周更新 2025-01-08 第288期
文章
Measuring code size and performance
他的场景 不用异常处理错误,还是快的。虽然这些年来异常已经进化了快了一些
Reminder: When a C++ object fails to construct, the destructor does not run
注意你手写的guard类 构造函数不能失败,否则构造失败不析构就泄漏了
Regular expressions can blow up!
省流,fuck std::regex
#include <iostream>
#include <regex>
int main() {
std::string text = "Everyone loves Lucy.";
std::regex pattern(R"(.*+s}}@w)");
// Perform regex search
std::smatch match;
bool found = std::regex_search(text, match, pattern);
std::cout << "Regex search result: "
<< (found ? "Match found" : "No match") << std::endl;
return 0;
}
这段代码运行七分钟
std::nontype_t: What is it, and Why
抽象type 一个tag 重载 帮助function ref匹配constexpr函数
Protecting Coders From Ourselves: Better Mutex Protection
folly也有synchronizedwith<T>
感觉这个周刊写的越多越发现重复。。评论区不知道的说一下,不行就folly组件挨个介绍
借助 Windsurf Sonnet Debug 过程一例
虽然和c++没啥关系,分享只是感叹AI太强了,程序员真的有点可有可无了
Parsing JSON in C & C++: Singleton Tax
省流 池化加速助力 解析加快 局部性功劳
Pipeline architectures in C++ - Boguslaw Cyganek - Meeting C++ 2024
他讲的不是CPU那个pipeline,也不是任务调度那个pipeline,讲的是这个比玩意
template < typename InT, typename InE, typename Function >
requires std::invocable< Function, std::expected< InT, InE > >
&& is_expected< typename std::invoke_result_t< Function, std::expected< InT, InE > > >
constexpr auto operator | ( std::expected< InT, InE > && ex, Function && f ) -> typename std::invoke_result_t< Function, std::expected< InT, InE > >
{
return std::invoke( std::forward< Function >( f ), /***/ std::forward< std::expected< InT, InE > >( ex ) );
}
....
// ----------------------------------------------------------------------------------------------------------------
// Here we create our CUSTOM PIPE
auto res = PayloadOrError { Payload { "Start string ", 42 } } | Payload_Proc_1 | Payload_Proc_2 | Payload_Proc_3 ;
// ----------------------------------------------------------------------------------------------------------------
就是类似range的pipe语法传播
如何评价,光顾着耍帅了有点
C++ programmer's guide to undefined behavior: part 12 of 11
继续介绍坑点
std::reserve和std::resize区别
resize会初始化0, size == capacity
reserve不会 size == 0
但没有resize_with_overwrite这种跳过填0的操作,只有string有
resize reserve非常容易用错
注意无符号数取反问题
struct Element {
size_t width; // original non-scaled width
....
};
// You are using smart component system that uses
// IDs to refer to elements.
using ElementID = uint64_t;
// Positions in OpenGL/DirectX/Vulkan worlds are floats
struct Offset {
float x;
float y;
};
size_t get_width(ElementID);
float screen_scale();
void move_by(ElementID, Offset);
void on_unchecked(ElementID el) {
auto w = get_width(el);
move_by(el, Offset {
-w * screen_scale() * 0.3f,
0.0f
});
}
这个-w必有问题,另外编译选项查不出来
对齐和隐式创建引发的问题
#pragma pack(1)
struct Record {
long value;
int data;
char status;
};
int main() {
Record r { 42, 42, 42};
static_assert(sizeof(r) == sizeof(int) + sizeof(char) + sizeof(long));
std::cout <<
std::format("{} {} {}", r.data, r.status, r.value); // 42 - '*'
}
看这没问题?
int main() {
Record records[] = { { 42, 42, 42}, { 42, 42, 42} };
static_assert(sizeof(records) ==
2 * ( sizeof(int) + sizeof(char) + sizeof(long) ));
for (const auto& r: records) {
std::cout << std::format("{} {} {}", r.data, r.status, r.value); // 42 - '*'
}
}
问题来自赋值隐式创建int 但实际上不是int,是pack bit
怎么解决?复制一份
int main() {
Record records[] = { { 42, 42, 42}, { 42, 42, 42} };
for (const auto& r: records) {
// C++23 has wonderful auto() for this purpose
std::cout << std::format("{} {} {}",
auto(r.data), auto(r.status), auto(r.value));
// In C++20,
auto data = r.data; auto status = r.status; auto value = r.value;
std::cout << std::format("{} {} {}", data, status, value);
// Or completely ugly and unstable to type changes
std::cout << std::format("{} {} {}", static_cast<int>(r.data),
static_cast<char>(r.status),
static_cast<long>(r.value>));
}
}
但实际上编译器应该阻止这种行为
后面还有coroutine的问题,特长。我准备拆开单独写一下
一个cmakelist warn设置
set (MY_CXX_FLAGS
"-Wall \
-Wextra \
-Werror \
-Wsuggest-override \
-Wno-unknown-warning-option \
-Wno-array-bounds \
-pedantic-errors" )
set (CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} ${MY_CXX_FLAGS}")
开源项目介绍
- asteria 一个脚本语言,可嵌入,长期找人,希望胖友们帮帮忙,也可以加群753302367和作者对线
- https://github.com/msqr1/importizer 帮助把include转成module 点子有意思
- https://github.com/meow-watermelon/puppy-eye 一个监控命令行,有点意思
C++ 中文周刊 2025-01-12 第175期
公众号
点击「查看原文」跳转到 GitHub 上对应文件,链接就可以点击了
qq群 点击进入 满了加这个 729240657
欢迎投稿,推荐或自荐文章/软件/资源等,评论区留言
本期文章由 MSK 赞助 老板大气祝老板永远不死
资讯
标准委员会动态/ide/编译器信息放在这里
编译器信息最新动态推荐关注hellogcc公众号 本周更新 2025-01-08 第288期
文章
Counting the digits of 64-bit integers
其实比较常规,就是查表
int int_log2(uint64_t x) { return 63 - __builtin_clzll(x | 1); } // c++20可以用bit_width
int digit_count(uint64_t x) {
static uint64_t table[] = {9,
99,
999,
9999,
99999,
999999,
9999999,
99999999,
999999999,
9999999999,
99999999999,
999999999999,
9999999999999,
99999999999999,
999999999999999ULL,
9999999999999999ULL,
99999999999999999ULL,
999999999999999999ULL,
9999999999999999999ULL};
int y = (19 * int_log2(x) >> 6);
y += x > table[y];
return y + 1;
}
或者更极端一点
int alternative_digit_count(uint64_t x) {
static uint64_t table[64][2] = {
{ 0x01, 0xfffffffffffffff6ULL },
{ 0x01, 0xfffffffffffffff6ULL },
{ 0x01, 0xfffffffffffffff6ULL },
{ 0x01, 0xfffffffffffffff6ULL },
{ 0x02, 0xffffffffffffff9cULL },
{ 0x02, 0xffffffffffffff9cULL },
{ 0x02, 0xffffffffffffff9cULL },
{ 0x03, 0xfffffffffffffc18ULL },
{ 0x03, 0xfffffffffffffc18ULL },
{ 0x03, 0xfffffffffffffc18ULL },
{ 0x04, 0xffffffffffffd8f0ULL },
{ 0x04, 0xffffffffffffd8f0ULL },
{ 0x04, 0xffffffffffffd8f0ULL },
{ 0x04, 0xffffffffffffd8f0ULL },
{ 0x05, 0xfffffffffffe7960ULL },
{ 0x05, 0xfffffffffffe7960ULL },
{ 0x05, 0xfffffffffffe7960ULL },
{ 0x06, 0xfffffffffff0bdc0ULL },
{ 0x06, 0xfffffffffff0bdc0ULL },
{ 0x06, 0xfffffffffff0bdc0ULL },
{ 0x07, 0xffffffffff676980ULL },
{ 0x07, 0xffffffffff676980ULL },
{ 0x07, 0xffffffffff676980ULL },
{ 0x07, 0xffffffffff676980ULL },
{ 0x08, 0xfffffffffa0a1f00ULL },
{ 0x08, 0xfffffffffa0a1f00ULL },
{ 0x08, 0xfffffffffa0a1f00ULL },
{ 0x09, 0xffffffffc4653600ULL },
{ 0x09, 0xffffffffc4653600ULL },
{ 0x09, 0xffffffffc4653600ULL },
{ 0x0a, 0xfffffffdabf41c00ULL },
{ 0x0a, 0xfffffffdabf41c00ULL },
{ 0x0a, 0xfffffffdabf41c00ULL },
{ 0x0a, 0xfffffffdabf41c00ULL },
{ 0x0b, 0xffffffe8b7891800ULL },
{ 0x0b, 0xffffffe8b7891800ULL },
{ 0x0b, 0xffffffe8b7891800ULL },
{ 0x0c, 0xffffff172b5af000ULL },
{ 0x0c, 0xffffff172b5af000ULL },
{ 0x0c, 0xffffff172b5af000ULL },
{ 0x0d, 0xfffff6e7b18d6000ULL },
{ 0x0d, 0xfffff6e7b18d6000ULL },
{ 0x0d, 0xfffff6e7b18d6000ULL },
{ 0x0d, 0xfffff6e7b18d6000ULL },
{ 0x0e, 0xffffa50cef85c000ULL },
{ 0x0e, 0xffffa50cef85c000ULL },
{ 0x0e, 0xffffa50cef85c000ULL },
{ 0x0f, 0xfffc72815b398000ULL },
{ 0x0f, 0xfffc72815b398000ULL },
{ 0x0f, 0xfffc72815b398000ULL },
{ 0x10, 0xffdc790d903f0000ULL },
{ 0x10, 0xffdc790d903f0000ULL },
{ 0x10, 0xffdc790d903f0000ULL },
{ 0x10, 0xffdc790d903f0000ULL },
{ 0x11, 0xfe9cba87a2760000ULL },
{ 0x11, 0xfe9cba87a2760000ULL },
{ 0x11, 0xfe9cba87a2760000ULL },
{ 0x12, 0xf21f494c589c0000ULL },
{ 0x12, 0xf21f494c589c0000ULL },
{ 0x12, 0xf21f494c589c0000ULL },
{ 0x13, 0x7538dcfb76180000ULL },
{ 0x13, 0x7538dcfb76180000ULL },
{ 0x13, 0x7538dcfb76180000ULL },
{ 0x13, 0x7538dcfb76180000ULL },
};
int log = int_log2(x);
uint64_t low = table[log][1];
uint64_t high = table[log][0];
return (x + low < x ) + high;
}
评论区大哥给了一个更快的
inline uint8_t digitCounts64[]{ 19, 19, 19, 19, 18, 18, 18, 17, 17, 17, 16, 16, 16, 16, 15, 15, 15, 14, 14, 14, 13, 13, 13, 13, 12, 12, 12, 11, 11, 11, 10, 10, 10,
10, 9, 9, 9, 8, 8, 8, 7, 7, 7, 7, 6, 6, 6, 5, 5, 5, 4, 4, 4, 4, 3, 3, 3, 2, 2, 2, 1, 1, 1, 1, 1 };
inline uint64_t digitCountThresholds64[]{ 0ull, 9ull, 99ull, 999ull, 9999ull, 99999ull, 999999ull, 9999999ull, 99999999ull, 999999999ull, 9999999999ull,
99999999999ull, 999999999999ull, 9999999999999ull, 99999999999999ull, 999999999999999ull, 9999999999999999ull, 99999999999999999ull, 999999999999999999ull,
9999999999999999999ull };
inline uint64_t fastDigitCount(const uint64_t inputValue) {
const uint64_t originalDigitCount{ digitCounts64[__builtin_clzll(inputValue)] };
return originalDigitCount + (inputValue > digitCountThresholds64[originalDigitCount]);
}
另外这个大哥写了个json库很快。和glaze有一拼 https://github.com/RealTimeChris/Jsonifier/
C++26: a placeholder with no name
总算不用使用 decltype(std::ignore) _;
了 c++26支持了
Inside STL: Waiting for a std::atomic<std::shared_ptr> to change, part 1 Part2
省流std::atomic<std::shared_ptr>::notify_one
linux平台由于futex的问题,没有很好的实现
windows有waitonaddress
constexpr std::string的一个好处
可以写编译期测试 static_assert
constexpr std::string
decode(std::span<const unsigned char> payload)
{
static constexpr unsigned char MASK{0x7F};
std::string result{};
int shift{};
unsigned char mask{MASK};
for(unsigned char scratch{}; auto c : payload) {
const unsigned char realChar =
((c & mask) << shift) | scratch;
scratch = (c & (~mask)) >> (7 - shift);
++shift;
mask >>= 1;
result += static_cast<char>(realChar);
if(7 == shift) {
result += static_cast<char>(scratch);
shift = 0;
mask = MASK;
scratch = 0;
}
}
return result;
}
constexpr auto make_array(auto... values)
{
return std::array<unsigned char, sizeof...(values)>{
static_cast<unsigned char>(values)...};
}
void Use()
{
constexpr auto payload{make_array(0xd3,
0x74,
0x1b,
0xce,
0x2e,
0x83,
0xa6,
0xcd,
0x29,
0x88,
0x5e,
0xc6,
0xd3,
0x5d)};
constexpr auto payload2{make_array(0xc8,
0x32,
0x9b,
0xfd,
0x66,
0x81,
0x86,
0xab,
0x55,
0x08,
0x44,
0x45,
0xa7,
0xe7,
0xa0,
0xf4,
0x1c,
0x34,
0x46,
0x97,
0xc7,
0xeb,
0xb4,
0xfb,
0x0c,
0x0a,
0x83,
0xe6,
0x74,
0xb2,
0x4e,
0x37,
0xa7,
0xcb,
0xd3,
0xee,
0x33,
0x28,
0x4c,
0x07,
0x8d,
0xdf,
0x6d,
0x78,
0x9a,
0x5d,
0x06,
0xd1,
0xd3,
0xed,
0x72,
0x08,
0xe4,
0x4c,
0x8f,
0xcb,
0x2c,
0x50,
0x7a,
...
C++ 中文周刊 2024-12-29 第174期
公众号
点击「查看原文」跳转到 GitHub 上对应文件,链接就可以点击了
qq群 点击进入
欢迎投稿,推荐或自荐文章/软件/资源等,评论区留言
本期文章由 Amnesia wyhqaq HNY 赞助 在此表示感谢
老板大气祝老板永远不死
资讯
标准委员会动态/ide/编译器信息放在这里
[编译器信息最新动态推荐关注hellogcc公众号 本周更新 2024-01-04 第286期](OSDT Weekly 2024-12-25 第286期 )
文章
Retrofitting spatial safety to hundreds of millions of lines of C++
google在 c++安全上的实践,主要是采用libc++ harden mode
Structured Binding Upgrades in C++26
支持字段级别设置attr了 p0609
auto [it, inserted [[maybe_unused]] ] = map.try_emplace(key, value);
支持在条件中展开,类似c++17那个条件中赋值
if (auto [n] = f()) { ... }
while (auto [header, body] = receive_packet()) { ... }
展开绑定到tuple p1061
template <class T>
auto tie_as_tuple(T& x) {
auto& [...xs] = x;
return std::tie(xs...);
}
如果这个能支持,真是有点改变相关工具生态了 magic get/boost pfr可是做了好多脏活
How to Hash Objects Without Repetition: std::hash can be DRY
介绍hash combine和 tie组合的。
#include <string>
#include <tuple>
#include <cassert>
#include <cstdint>
#include <boost/functional/hash.hpp>
#include <iostream>
namespace some_lib {
template <typename T>
constexpr void hash_combine(size_t& seed, const T& value)
{
seed ^= std::hash<T>{}(value) + 0x9e3779b9 + (seed << 6) + (seed >> 2);
}
}
template <typename... TValues>
constexpr auto combined_hash(const TValues&... values)
{
size_t seed{};
(..., some_lib::hash_combine(seed, values));
return seed;
}
struct HashableForTiedMembers
{ };
template <typename T>
constexpr bool hashing_for_tied_members = false;
template <typename T>
concept HashableForTied = std::derived_from<T, HashableForTiedMembers> || hashing_for_tied_members<T>;
template <HashableForTied T>
struct std::hash<T>
{
size_t operator()(const T& value) const
{
auto hasher = [](const auto&... args) {
return combined_hash(args...);
};
return std::apply(hasher, value.tied());
}
};
template <typename T>
concept Hashable = requires {
{ std::hash<T>{}(std::declval<T>()) } -> std::convertible_to<size_t>;
};
/////////////////////////////////////////////////////////////////////////
// Person class - opt-in through inheritance
struct Person : HashableForTiedMembers
{
std::string first_name;
std::string last_name;
std::uint8_t age;
Person(std::string first_name, std::string last_name, std::uint8_t age)
: first_name{std::move(first_name)}
, last_name{std::move(last_name)}
, age{age}
{
}
auto tied() const
{
return std::tie(first_name, last_name, age);
}
bool operator==(const Person& other) const
{
return tied() == other.tied();
}
auto operator<=>(const Person& other) const
{
return tied() == other.tied();
}
};
static_assert(Hashable<Person>);
//////////////////////////////////////////////////////////////////////////
// AggregatePerson - opt-in through variable template specialization
struct AggregatePerson
{
std::string first_name;
std::string last_name;
std::uint8_t age;
auto tied() const
{
return std::tie(first_name, last_name, age);
}
};
template <>
constexpr bool hashing_for_tied_members<AggregatePerson> = true;
int main()
{
Person p1{"John", "Doe", 33};
Person p2{"John", "Doe", 33};
Person p3{"John", "Don", 44};
assert(p1 == p2);
assert(p2 < p3);
assert(std::hash<Person>{}(p1) == std::hash<Person>{}(p2));
assert(std::hash<Person>{}(p1) == std::hash<Person>{}(p3));
AggregatePerson ap1{"John", "Doe", 30};
AggregatePerson ap2{"John", "Doe", 30};
AggregatePerson ap3{"John", "Dog", 30};
assert(std::hash<AggregatePerson>{}(ap1) == std::hash<AggregatePerson>{}(ap2));
assert(std::hash<AggregatePerson>{}(ap1) != std::hash<AggregatePerson>{}(ap3));
return std::hash<Person>{}(p1);
}
其实他这个设计就是hash_append
template <class HashAlgorithm>
friend void hash_append(HashAlgorithm& h, X const& x) noexcept
{
//
}
他这个写法就是把hash算法和x拆出来,x本身转pack 方便归一计算,用的tie 避免开销
combined_hash其实就是hash_append 只不过算法h不能定制
不知道读者们了不了解n3980 hash_append 不了解没关系。就是函数接口定制和这里的代码一个意思
Measuring std::unordered_map Badness
非常搞笑的场景,同样的hashmap float 做key和 int做key冲突率不同 因为值域不同。float表达式导致的
针对float做key要注意hash算法
Inside STL: The atomic shared_ptr
和shared_ptr差不多,为了原子 使用tag pointer 用特殊字段做spinlock 代码在这里
while (!_M_val.compare_exchange_strong(__current,
__current | _S_lock_bit,
__o,
memory_order_relaxed))
{
_GLIBCXX_TSAN_MUTEX_TRY_LOCK_FAILED(&_M_val);
#if __glibcxx_atomic_wait
__detail::__thread_relax();
#endif
__current = __current & ~_S_lock_bit;
_GLIBCXX_TSAN_MUTEX_TRY_LOCK(&_M_val);
}
_GLIBCXX_TSAN_MUTEX_LOCKED(&_M_val);
return reinterpret_cast<pointer>(__current);
}
Type-safe Enum Class Bit Flags
直接贴代码
#include <bitset>
#include <ostream>
#include <type_traits>
#include <utility>
// Helper class for bitwise flag-like operations on scoped enums.
//
// This class provides a way to represent combinations of enum values without
// directly overloading operators on the enum type itself. This approach
// avoids ambiguity in the type system and allows the enum type to continue
// representing a single value, while the BitFlags can hold a combination
// of enum values.
//
// Example usage:
//
// enum class MyEnum { FlagA = 1 << 0, FlagB = 1 << 1, FlagC = 1 << 2 };
//
// BitFlags<MyEnum> flags = { MyEnum::FlagA, MyEnum::FlagC };
// flags.Unset(MyEnum::FlagA);
// if (flags.IsSet(MyEnum::FlagC)) {
// // ...
// }
//
// flags |= MyEnum::FlagB;
// BitFlags<MyEnum> new_flags = ~flags;
template <typename T>
class BitFlags {
using UnderlyingT = std::underlying_type_t<T>;
public:
constexpr BitFlags() : flags_(static_cast<UnderlyingT>(0)) {}
constexpr explicit BitFlags(T v) : flags_(ToUnderlying(v)) {}
constexpr BitFlags(std::initializer_list<T> vs) : BitFlags() {
for (T v : vs) {
flags_ |= ToUnderlying(v);
}
}
// Checks if a specific flag is set.
constexpr bool IsSet(T v) const {
return (flags_ & ToUnderlying(v)) == ToUnderlying(v);
}
// Sets a single flag value.
constexpr void Set(T v) { flags_ |= ToUnderlying(v); }
// Unsets a single flag value.
constexpr void Unset(T v) { flags_ &= ~ToUnderlying(v); }
// Clears all flag values.
constexpr void Clear() { flags_ = static_cast<UnderlyingT>(0); }
constexpr operator bool() const {
return flags_ != static_cast<UnderlyingT>(0);
}
friend constexpr BitFlags operator|(BitFlags lhs, T rhs) {
return BitFlags(lhs.flags_ | ToUnderlying(rhs));
}
friend constexpr BitFlags operator|(BitFlags lhs, BitFlags rhs) {
return BitFlags(lhs.flags_ | rhs.flags_);
}
friend constexpr BitFlags operator&(BitFlags lhs, T rhs) {
return BitFlags(lhs.flags_ & ToUnderlying(rhs));
}
friend constexpr BitFlags operator&(BitFlags lhs, BitFlags rhs) {
return BitFlags(lhs.flags_ & rhs.flags_);
}
friend constexpr BitFlags operator^(BitFlags lhs, T rhs) {
return BitFlags(lhs.flags_ ^ ToUnderlying(rhs));
}
friend constexpr BitFlags operator^(BitFlags lhs, BitFlags rhs) {
return BitFlags(lhs.flags_ ^ rhs.flags_);
}
friend constexpr BitFlags& operator|=(BitFlags& lhs, T rhs) {
lhs.flags_ |= ToUnderlying(rhs);
return lhs;
}
friend constexpr BitFlags& operator|=(BitFlags& lhs, BitFlags rhs) {
lhs.flags_ |= rhs.flags_;
return lhs;
}
friend constexpr BitFlags& operator&=(BitFlags& lhs, T rhs) {
lhs.flags_ &= ToUnderlying(rhs);
return lhs;
}
friend constexpr BitFlags& operator&=(BitFlags& lhs, BitFlags rhs) {
lhs.flags_ &= rhs.flags_;
return lhs;
}
friend constexpr BitFlags& operator^=(BitFlags& lhs, T rhs) {
lhs.flags_ ^= ToUnderlying(rhs);
return lhs;
}
friend constexpr BitFlags& operator^=(BitFlags& lhs, BitFlags rhs) {
lhs.flags_ ^= rhs.flags_;
return lhs;
}
friend constexpr BitFlags operator~(const BitFlags& bf) {
return BitFlags(~bf.flags_);
}
friend constexpr bool operator==(const BitFlags& lhs, const BitFlags& rhs) {
return lhs.flags_ == rhs.flags_;
}
friend constexpr bool operator!=(const BitFlags...
C++ 中文周刊 2024-11-23 第173期
公众号
点击「查看原文」跳转到 GitHub 上对应文件,链接就可以点击了
qq群 点击进入 满了加这俩 729240657 866408334
欢迎投稿,推荐或自荐文章/软件/资源等,评论区留言
本期文章由 LH_mouse 赞助 在此表示感谢
祝老板身体健康事业顺利开新车装新房夜夜当新郎全世界都有你的丈母娘
资讯
标准委员会动态/ide/编译器信息放在这里
来自本台记者Mick前方发来的报道
欢迎来到C++26的第五次会议,也是feature freeze之前的倒数第二次会议。本次会议共约230人参与,31个NB参会,依然是传统的线下:线上=2:1模式
在通过的提案方面,本次共通过8篇语言提案和19篇库提案。这比上次会议的7+12要多一些,和东京正好持平。
语言方面,最重磅的也是最坎坷的提案无疑是P1061 auto [...xs] = ... (structured binding packs),作为上次Plenary中被撤销的提案,P1061本来应该波澜不惊地再次投票。没想到的是,EWG第三天的讨论中MSVC开发者提出了对实现难度的抗议,差一点导致本提案倒在Stage 2。幸运的是,最后作者找到了一个妥协方案,将带pack的structured binding限制在只能在模版中使用,从而成功进入标准。除此之外,语言方面还通过了P3068,允许在编译期抛出异常。(当然,异常不能离开编译期,编译抛运行catch是不行的),并且常规deprecate了一批特性(is_trivial,不带逗号的varargs语法)。
LWG方面,最重磅的提案无疑是极度坎坷的P1928 std::simd。本提案的历史极其悠久,从2013年的N3759初创之后,-> N4184/5 -> N4395 -> P0214R9这14个revision之后终于在2018年修成半个正果,成功进入Parallelism TS v2。不过,随后的IS merge依然极度艰难,大规模的设计改动和名称反复贯穿了P1928的历史,最终在用了十年,30个revision之后终于成功进入C++26。本提案事实上大体标准化了SIMD指令,让标准中可以直接像操纵其他原生类型一样操作SIMD向量。至此,C++26标准库的两个T0和一个T0.5特性均已成功进入标准,L(E)WG成功提前完成了自己本周期的目标。下一次会议的主要目标看来就是搞定hive这个老大难。 另一个重点提案就是P3019 indirect/polymorphic,即一个deep copy版的智能指针。从cloned_ptr走到indirect_value走到indirect,花了P0201R6 -> P3019R11的19个revision才走完这条路,不过好歹是走完了。现在pimpl就可以用标准解法了。
除此之外,本次搞定了大量的线性代数bugfix提案,包括aligned_accessor,submdspan fix等对C++26至关重要的提案被成功完成(还剩下atomic_accessor和rank-2k两个提案,预计下次吧)。另外,本次会议还迈出了C23 rebase的第一步,成功将C23新增的两个头文件(bits,安全整数加法)加入了C++26。
本次会议的Stage 2工作组相对来说更有看点一些。EWG方面,P2786平凡迁移和P2900 Contracts均成功被推进Stage 3,但是两者的争议都非常大,forwarding poll可以说是barely consensus,要避免Plenary的失败还有很长的路要走。第三天的讨论中,反射终于确定了使用^^语法(unibrow),并逐渐开始在一些post-P2996反射提案上有了进展(比如consteval block,可惜expansion statement依然卡死着)。第四天早上是模式匹配的主场,虽然这一特性进入26的希望已经非常渺茫,但是P2688仍然在为此努力,并成为了EWG选择的语法而不是P2392的is/as。较为遗憾的是,原本应该在本次会议通过的fiber_context在最后一刻找到了Windows下的实现难题,只得推迟到下个周期去了。
LEWG方面,P2996反射和P2900 Contracts同样进入了Stage 3,从而扫清了这两个语言的主要目标在库这边的障碍。除此之外,整周大部分都在搞S&R相关扩展,例如async_scope,system scheduler等对P2300发挥作用至关重要的补充提案拿到了一定进展(所以lazy啥时候有人愿意接手…)。遗憾的是,concurrent queue依然在Concurrency TS v3和IS之间举棋不定,进入26的希望已经较为渺茫。除此之外,type_order_v也进入了Stage 3,有望给所有类型一个标准化的偏序关系。
Stage 1工作组方面,SG9 Ranges完成了Range化的并行算法的设计,但是离自己的plan依然差的有点远()。SG21 Contracts在完善Wording的同时,已经渐渐转向post-MVP特性,例如把语言UB大部分转成Contracts。SG23 Security完成了Profile的初版设计,不过前景究竟如何还要看看
展望明年的会议总体情况,“双边反转”已经基本成为事实,20/23周期的末尾都是LWG提案太多完不成不得不扔掉一些,这次LWG已经完成了绝大多数大提案,队伍反而不是很挤。提案太多完不成的变成了CWG,队伍里三个大提案实在有点吃不消,要做好CWG扔掉一堆小提案的准备。
编译器信息最新动态推荐关注hellogcc公众号 本周没更新 点击跳转上周的
文章
Exploring C++ std::span – Part 4: Const-Correctness and Type-Safety
还是介绍span的优缺点。这里介绍一种API冗余的问题
#include <span>
#include <iostream>
#include <vector>
void processData(int* data, std::size_t size) {
std::cout << "fucked";
}
void processData(std::span<int> data) {
std::cout << "ok";
}
int main() {
std::vector<int> v{ 1,3, 5,7, 9};
processData({v.data(), v.size()});
}
两种接口存在误用可能,保留一个即可
How do I put a non-copyable, non-movable, non-constructible object into a std::optional?
The operations for reading and writing single elements for C++ standard library maps
raymood chen这俩文章是连着的,我就放在一起讲了
一个是如何处理optional构造不能复制/移动的对象,简单来说解决方案就是类似std::elide
看代码 godbolt
#include <vector>
#include <string>
#include <iostream>
#include <optional>
struct Region {
int dummy[100];
};
struct Widget
{
Widget(Region const& region) {
}
Widget() = delete;
Widget(Widget const&) = delete;
Widget(Widget &&) = delete;
Widget& operator=(Widget const&) = delete;
Widget& operator=(Widget &&) = delete;
static Widget CreateInside(Region const& region) {
std::cout << "inside\n";
return Widget(region);
}
static Widget CreateOutside(Region const& region) {
std::cout << "outside\n";
return Widget(region);
}
private:
int dummy[100];
};
struct WidgetInsideRegionCreator
{
WidgetInsideRegionCreator(Region const& region) : m_region(region) {}
operator Widget() { return Widget::CreateInside(m_region); }
Region const& m_region;
};
template<typename F>
struct EmplaceHelper
{
EmplaceHelper(F&& f) : m_f(f) {}
operator auto() { return m_f(); }
F& m_f;
};
int main()
{
Region region;
// construct with a Widget value
std::optional<Widget> o0(WidgetInsideRegionCreator(region)); //函数声明我草
std::optional<Widget> o{WidgetInsideRegionCreator(region)};
std::optional<Widget> o2;
// or place a Widget into the optional
o2.emplace(WidgetInsideRegionCreator(region));
// construct with a Widget value
// 为什么这个不被解析成函数声明?
std::optional<Widget> o3(
EmplaceHelper([&] {
return Widget::CreateInside(region);
}));
std::optional<Widget> o4;
// or place a Widget into the optional
o4.emplace(EmplaceHelper([&] {
return Widget::CreateInside(region);
}));
}
简单来说是通过optional的成员构造,从T本身构造,通过wrapper转发给optional隐式构造
第二篇文章是 map插入接口复杂以及带来的构造问题
Operation 操作 | Method 方法 |
---|---|
Read, throw if missing读取,如果缺失则抛出异常 | m.at(key) |
Read, allow missing 阅读,允许缺失 | m.find(key) |
Read, create if missing阅读,如果不存在则创建 | m[key] |
Write, nop if exists, discard value写入,如果存在则 nop,丢弃值 | m.insert({ key, value }) |
m.emplace(key, value) | |
Write, nop if exists写入,如果存在则 nop | m.emplace(std::piecewise_construct, ...) |
m.try_emplace(key, params) | |
Write, overwrite if exists编写,如果存在则覆盖 | m.insert_or_assign(key, value) |
这么多接口,想实现如果没有就插入,如果有不要浪费构造这种逻辑,怎么做?
template<typename Map, typename Key, typename... Maker>
auto& ensure(Map&& map, Key&& key, Maker&&... maker)
{
auto lower = map.lower_bound(key);
if (lower == map.end() || map.key_comp()(lower->first, key)) {
lower = map.emplace_hint(lower, std::forward<Key>(key),
std::invoke(std::forward<Maker>(maker)...));
}
return lower->second;
}
auto& ensure_named_widget(std::string const& name)
{
return ensure(widgets, name,
[](auto&& name) { return std::make_shared<Widget>(name); },
name);
}
一坨屎啊,注意到我们转发的这个逻辑,其实就是上面的elide
之前在115期也介绍过 优化insert
insert可能不成功,所以需要推迟value构造,惰性构造
template <class F>
struct lazy_call {
F f;
template <class T> operator T() { return f(); }
};
#define LAZY(expr) lazy_call{[&]{ return expr; }}
auto [iter, success] = map.try_emplace(key, LAZY(acquire_value()));
应该有机会合入,代码也很简单 godbolt
那我们可以用emplacehelper,也就是elide重新实现一下,就用try_emplace就好了
template<typename Map, typename Key, typename... Maker>
auto& ensure(Map&& map, Key&& key, Maker&&... maker)
{
return *map.try_emplace(key, EmplaceHelper([&] {
return std::invoke(std::forward<Maker>(maker)...);
}).first;
}
一行,甚至都不用封装这么丑的代码,直接在用到map的地方直接调用就行,比如
auto& item =
*widgets.try_emplace(name, EmplaceHelper([&] {
return std::make_shared<Widget>(name); })).first;
Some Of My Experience About Linking C/C++ On Linux
简单来说就是符号查找的问题
比如不同库可能的符号覆盖,符号weak strong之类的说明,不了解的建议翻翻《链接装载库》,虽然旧也够用
引申阅读 问题排查:C++ exception with description “getrandom“ thrown in the test body
找不到符号 -> 宿主机没提供 编译问题,版本没对上,实现链接了不存在的符号
Retrofitting spatial safety to hundreds of millions of lines of C++
[加固详细介绍](https://l...
C++ 中文周刊 2024-11-16 第172期
公众号
点击「查看原文」跳转到 GitHub 上对应文件,链接就可以点击了
qq群 点击进入 满了加这俩 729240657 866408334
欢迎投稿,推荐或自荐文章/软件/资源等,评论区留言
本期文章由 HNY 赞助 在此表示感谢
资讯
标准委员会动态/ide/编译器信息放在这里
编译器信息最新动态推荐关注hellogcc公众号 本周更新 2024-11-13 第280期
可以使用 -Wunsafe-buffer-usage
目前还在开发中
在noexcept 基础上增加了noblocking noallocating
更准确分析函数行为,可以配合之前介绍的RealTimeSan使用
主要问题是函数指针不行,函数指针/function自动丢弃上述属性
另外存在属性覆盖,noblocking noallocating的必要条件是noexcept,权限大于,大家懂我意思吧
函数指针怎么绕过
std::sort(vec.begin(), vec.end(),
[](const Elem& a, const Elem& b) [[clang::nonblocking]] { return a.mem < b.mem; }); // OK
static bool compare_elems(const Elem& a, const Elem& b) [[clang::nonblocking]] {
return a.mem < b.mem; }; // 不行 属性会丢
std::sort(vec.begin(), vec.end(), compare_elems);
template <typename>
class nonblocking_fp;
template <typename R, typename... Args>
class nonblocking_fp<R(Args...)> {
public:
using impl_t = R (*)(Args...) [[clang::nonblocking]];
private:
impl_t mImpl{ nullptr_t };
public:
nonblocking_fp() = default;
nonblocking_fp(impl_t f) : mImpl{ f } {}
R operator()(Args... args) const
{
return mImpl(std::forward<Args>(args)...);
}
};
// deduction guide (like std::function's)
template< class R, class... ArgTypes >
nonblocking_fp( R(*)(ArgTypes...) ) -> nonblocking_fp<R(ArgTypes...)>;
// --
// Wrap the function pointer in a functor which preserves ``nonblocking``.
std::sort(vec.begin(), vec.end(), nonblocking_fp{ compare_elems });
文章
~~我用得着你说?~~强调span不容易用错
template<typename T>
class HasIsNullMethod {
struct Yes { char unused[1]; };
struct No { char unused[2]; };
template <typename U, U u> struct reallyHas;
template <typename C> static Yes& test(reallyHas<char (C::*)(), &C::isNull>* /*unused*/) { }
template <typename C> static Yes& test(reallyHas<char(C::*)() const, &C::isNull>* /*unused*/) { }
// template<class C> static Yes test(char(*)[static_cast<int>(&C::isNull == false) + 1]) {}
template<class C> static No test(...);
public:
static const bool Value = (sizeof(test<T>(0)) == sizeof(Yes));
};
struct A {
char isNull() {}
};
struct B {
void isNull() {}
};
struct C {
char isNull;
};
bool fA() {
return HasIsNullMethod<A>::Value;
}
bool fB() {
return HasIsNullMethod<B>::Value;
}
bool fC() {
return HasIsNullMethod<C>::Value;
}
// Type your code here, or load an example.
bool fint()
{
return HasIsNullMethod<int>::Value;
}
#include <iostream>
int main() {
std::cout << fint() << "\n";
std::cout << fA()<< "\n";
std::cout << fB()<< "\n";
std::cout << fC()<< "\n";
return 0;
}
godbolt 不会也没啥,糟粕 喜欢怀旧可以看一下
当实现pimpl惯用法的时候,使用unique_ptr通常因为看不到完整实现(析构)调用失败
作者给的办法是手动加上deleter
不要听他的,直接用shared_ptr,不要多此一举好吧
介绍timezone
我记得有一个date库就做了这个活,用不上可以直接用那个date
简单贴一下代码,介绍一下接口
#include <chrono>
#include <print>
int main() {
const auto now = std::chrono::system_clock::now();
auto zt_local = std::chrono::zoned_time{ std::chrono::current_zone(), now };
std::print("now is {} UTC and local is: {}\n", now, zt_local);
constexpr std::string_view Warsaw{ "Europe/Warsaw" };
constexpr std::string_view NewYork{ "America/New_York" };
constexpr std::string_view Tokyo{ "Asia/Tokyo" };
try
{
const std::chrono::zoned_time zt_w{Warsaw, now};
std::print("Warsaw: {0:%F} {0:%R}\n", zt_w);
const std::chrono::zoned_time zt_ny{NewYork, now};
std::print("New York: {0:%F} {0:%R}\n", zt_ny);
const std::chrono::zoned_time zt_t{Tokyo, now};
std::print("Tokyo: {0:%F} {0:%R}\n", zt_t);
}
catch (std::runtime_error& ex)
{
std::print("Error: {}", ex.what());
}
}
/*
now is 2024-11-15 22:31:24.193993753 UTC and local is: 2024-11-15 22:31:24.193993753
Warsaw: 2024-11-15 23:31
New York: 2024-11-15 17:31
Tokyo: 2024-11-16 07:31
*/
godbolt 还有其他代码,就不贴了
这人不懂c++大惊小怪,就是简单的const延长生命周期
不看代码了。单纯喷他一下
老文章,valgrind不如sanitizer直接/快,且有遗漏
死循环优化
#include <iostream>
int fermat () {
const int MAX = 100;
int a=1,b=1,c=1;
int iter = 0;
while (1) {
if ( (a*a*a) == (b*b*b) + (c*c*c) ) {
std::cout << "Found!\n";
return 1;
}
a++;
if (a>MAX) {
a=1;
b++;
}
if (b>MAX) {
b=1;
c++;
}
if (c>MAX) {
c=1;
}
++iter;
}
return 0;
}
int main () {
if (fermat()) {
std::cout << "Fermat's Last Theorem has been disproved.\n";
} else {
std::cout << "Fermat's Last Theorem has not been disproved.\n";
}
return 0;
}
打印
Found!
Fermat's Last Theorem has been disproved.
由于return是死循环唯一出口,编译器激进到直接return 1
这个可以看lancern文章有介绍过 感谢zwuis提醒
#include <iostream>
#include <memory>
#include <vector>
struct Node {
int value = 0;
std::vector<Node> childrens;
};
struct List {
int value = 0;
std::unique_ptr<List> next;
~List() {
while (next) {
// The destructor is still recursive,
// but now the recursion depth is 1 call.
next = std::move(next->next);
}
}
List() noexcept = default;
List(List&&) noexcept = default;
List& operator=(List&&) noexcept = default;
};
int main() {
List dummynode;
List* l = &dummynode;
int BOUND = 1000;
int SUB_BOUND = 100;
for (int i = 1; i<BOUND; i++) {
l->value = i;
l->next = std::make_unique<List>();
l = l->next.get();
}
/*
// 这个析构会栈溢出
Node n;
auto tmp = &n;
for (int i = 1; i<BOUND; i++) {
for (int j = 0; j< SUB_BOUND; j++) {
Node c;
c.value = j*i;
tmp->childrens[j] = c;
// tmp = &tmp->childrens[j];
}
}
*/
}
noexcept问题 noexcept=noexcept(true), noexcept(cond) 可以自己定制
成员函数除了析构都是noexcept(false) ,如果析构函数抛异常需要显式指明
struct SoBad {
// invoke std::terminate
~SoBad() {
throw std::runtime_error("so bad dtor");
}
};
struct NotSoBad {
// OK
~NotSoBad() noexcept(false) {
throw std::runtime_error("not so bad dtor");
}
};
使用noexcept需要你写异常验证代码,避免terminate爆炸
缓冲区溢出问题
一大堆傻逼函数 scanf strcpy strcat gets strncat等等,哦还有memcpy
引申出数组越界问题,数组越界会被激进优化,一定要注意
其实有点和前面的例子很相似
const int N = 10;
int elements[N];
bool contains(int x) {
for (int i = 0; i <= N; ++i) {
if (x == elements[i]) {
return true;
}
}
return false;
}
int main() {
for (int i = 0; i < N; ++i) {
std::cin >> elements[i];
}
return contains(5);
}
存在越界 -> 越界是UB,编译器认为代码中没有UB,说明越界肯定不可达,说明提前返回 所以直接优化成true
类似例子
const int N = 10;
int main() {
int decade[N];
for (int k = 0; k <= N; ++k) {
printf("k is %d\n",k);
decade[k] = -1;
}
}
k越界,越界是UB,编译器认为代码中没有UB,说明永远到不了N,直接死循环
鉴定为不如varint,评论区有人指出性能比varint不太行,测试代码我拿来在7950x WSL跑了一下
2024-11-16T23:09:24+08:00
Running ./benchmarks/msft_proxy_benchmarks
Run on (32 X 4499.92 MHz CPU s)
CPU Caches:
L1 Data 32 KiB (x16)
L1 Instruction 32 KiB (x16)
L2 Unified 1024 KiB (x16)
L3 Unified 32768 KiB (x1)
Load Average: 0.65, 0.21, 0.11
---------------------------------------------------------------------------------------
Benchmark Time CPU Iterations
---------------------------------------------------------------------------------------
BM_SmallObjectInvocationViaProxy 4648790 ns 5071349 ns 136
BM_SmallObjectInvocationViaVirtualFunction 11986710 ns 13076183 ns 54
BM_SmallObjectInvocationViaVariant 5044399 ns 5495963 ns 127
BM_LargeObjectInvocationViaProxy 7689574 ns 8388641 ns 83
BM_LargeObjectInvocationViaVirtualFunction 9397069 ns 10251350 ns 68
BM_LargeObjectInvocationViaVariant 5046724 ns 5490317 ns 127
BM_SmallObjectManagementWithProxy 1...
C++ 中文周刊 2024-11-03 第171期
公众号
点击「查看原文」跳转到 GitHub 上对应文件,链接就可以点击了
qq群 点击进入 满了加这俩 729240657 866408334
欢迎投稿,推荐或自荐文章/软件/资源等,评论区留言
本期文章由 HNY 赞助 在此表示感谢
本期内容较少,掺杂一些互动
资讯
标准委员会动态/ide/编译器信息放在这里
编译器信息最新动态推荐关注hellogcc公众号 本周更新2024-10-30 第278期
文章
How useful is the hint passed to the std::unordered_… collections?
emplace_hit 在有序map有很大作用,但是在无序容器,由于不允许重复,hint基本没啥用
但无序容器存在允许重复值的 multixx,这种场景可以用,一般来说用不着
总结了一个表格
实现 | unordered_multixx | unordered_xx |
---|---|---|
是否允许重复 | 是 | 否 |
msvc/STL | 如果匹配就是用 | 如果匹配就使用 |
clang/libcxx | 忽略 | 如果匹配就使用 |
gcc/libstdc++ (large or fast) | 忽略 | 如果匹配就使用 |
gcc/libstdc++ (small and slow) | 忽略 | 使用 |
libstdc++针对不同key的hash有快慢识别,默认是快的 (long double慢) 这里有坑不知道大家记得不
群友mapleFU投稿
之前用 hint 优化过一些有序容器相关的处理( io range 维护什么的),感觉还是挺有用的
工厂函数的几种实现
其实就是static map,可以有多种维护方法
- 可以利用类来封装,利用宏生成多个static变量构造,来注册到map
- singleton模版注册也可以,利用模版实例化来调用注册到map 这两种都适合分散写法
这里有个例子 https://www.cnblogs.com/qicosmos/p/5090159.html
我就不贴代码了,脑补一下就有了
- 直接注册也可以,比如
static std::unordered_map<std::string, OptionTypeInfo>
lru_cache_options_type_info = {
{"capacity",
{offsetof(struct LRUCacheOptions, capacity), OptionType::kSizeT,
OptionVerificationType::kNormal, OptionTypeFlags::kMutable}},
{"num_shard_bits",
{offsetof(struct LRUCacheOptions, num_shard_bits), OptionType::kInt,
OptionVerificationType::kNormal, OptionTypeFlags::kMutable}},
{"strict_capacity_limit",
{offsetof(struct LRUCacheOptions, strict_capacity_limit),
OptionType::kBoolean, OptionVerificationType::kNormal,
OptionTypeFlags::kMutable}},
{"high_pri_pool_ratio",
{offsetof(struct LRUCacheOptions, high_pri_pool_ratio),
OptionType::kDouble, OptionVerificationType::kNormal,
OptionTypeFlags::kMutable}},
{"low_pri_pool_ratio",
{offsetof(struct LRUCacheOptions, low_pri_pool_ratio),
OptionType::kDouble, OptionVerificationType::kNormal,
OptionTypeFlags::kMutable}},
};
直接注册也未尝不可,直观,适合聚集写法
依赖dlopen也可以,不过属于杀鸡牛刀
如何判断一个数字是不是浮点数0?判断0正负 https://godbolt.org/z/jcqc38qqW
直接贴代码
#include <numeric>
#include <cmath>
#include <iostream>
class FloatingPointComparator {
private:
static constexpr double DEFAULT_EPSILON = 1e-10;
static constexpr double MIN_NORMAL = std::numeric_limits<double>::min();
static constexpr double MAX_NORMAL = std::numeric_limits<double>::max();
public:
// 基本的零值检查
static bool isZero(double value) {
return std::abs(value) < DEFAULT_EPSILON;
}
// 带自定义误差的零值检查
static bool isZeroWithEpsilon(double value, double epsilon) {
return std::abs(value) < epsilon;
}
// 相对误差检查
static bool isZeroRelative(double value) {
if (std::abs(value) < MIN_NORMAL) {
return true;
}
return std::abs(value) < DEFAULT_EPSILON * std::max(1.0, std::abs(value));
}
// IEEE 754 特殊值检查
static bool isSpecial(double value) {
return std::isnan(value) || std::isinf(value);
}
// 判断是否为正负零
static bool isExactZero(double value) {
return value == 0.0 || value == -0.0;
}
// 综合判断
static bool isEffectivelyZero(double value) {
if (isSpecial(value)) {
return false;
}
if (isExactZero(value)) {
return true;
}
return isZeroRelative(value);
}
};
class ZeroSignChecker {
public:
static bool isNegativeZero(double value) {
if (value != 0.0) return false;
/*
union {
double d;
uint64_t u;
} u = {value};
return (u.u >> 63) == 1;
*/
auto u = std::bit_cast<std::uint64_t>(value);
// 检查符号位(最高位)
return (u >> 63) == 1;
}
static bool isPositiveZero(double value) {
if (value != 0.0) return false;
/*
union {
double d;
uint64_t u;
} u = {value};
return (u.u >> 63) == 0;
*/
auto u = std::bit_cast<std::uint64_t>(value);
// 检查符号位
return (u >> 63) == 0;
}
static bool isPositiveZeroV2(double value) {
return value == 0.0 && !std::signbit(value);
}
static bool isNegativeZeroV2(double value) {
return value == 0.0 && std::signbit(value);
}
static bool isNegativeZeroCoreDump(double value) {
if (value != 0.0) return false;
return std::isinf(1.0 / value) && (1.0 / value < 0);
}
static bool isPositiveZeroCoreDump(double value) {
if (value != 0.0) return false;
return std::isinf(1.0 / value) && (1.0 / value > 0);
}
};
// 使用示例
void testZeroSign() {
double pzero = 0.0;
double nzero = -0.0;
std::cout << "Positive zero: " << ZeroSignChecker::isPositiveZero(pzero) << std::endl;
std::cout << "Negative zero: " << ZeroSignChecker::isNegativeZero(nzero) << std::endl;
std::cout << "Positive zero: " << ZeroSignChecker::isPositiveZeroV2(pzero) << std::endl;
std::cout << "Negative zero: " << ZeroSignChecker::isNegativeZeroV2(nzero) << std::endl;
}
// 使用示例
void testFloatingPoint() {
double values[] = {
0.0,
-0.0,
1e-15,
1e-10,
std::numeric_limits<double>::min(),
std::numeric_limits<double>::denorm_min(),
std::numeric_limits<double>::quiet_NaN(),
std::numeric_limits<double>::infinity()
};
for (double val : values) {
std::cout << "Value: " << val << std::endl;
std::cout << "Is zero? " << FloatingPointComparator::isEffectivelyZero(val) << std::endl;
std::cout << "Is special? " << FloatingPointComparator::isSpecial(val) << std::endl;
std::cout << "Is exact zero? " << FloatingPointComparator::isExactZero(val) << std::endl;
std::cout << "-------------------" << std::endl;
}
}
int main() {
testFloatingPoint();
testZeroSign();
return 0;
}
为什么 exit() 函数不是线程安全的? https://www.zhihu.com/question/2278762213/
主要原因 exit语义等同于从main 返回,会涉及到资源释放等相关流程,自然引入竞争问题
避免全局资源释放,使用quick_exit
另外直接列一下各种exit区别 https://learn.microsoft.com/en-us/previous-versions/6wdz5232(v=vs.140)
- exit 执行完整的 C 库终止过程,终止进程,并向主机环境提供提供的状态代码。
- _Exit 执行最少的 C 库终止过程,终止进程,并向主机环境提供提供的状态代码。
- _exit 执行最少的 C 库终止过程,终止进程,并向主机环境提供提供的状态代码。
- quick_exit 执行快速 C 库终止过程,终止进程,并向主机环境提供提供的状态代码。
- _cexit 执行完整的 C 库终止过程并返回给调用方。不终止进程。
- _c_exit 执行最少的 C 库终止过程并返回给调用方。不终止进程。
VC++中 log10(1e-23f) 向下舍入时,结果错误。如何解决? https://www.zhihu.com/question/1790209844/
msvc的log10f 和gcc libm的log10f行为不一样。大概实现算法有区别
两种结果都是符合标准的,毕竟round
互动环节
熬夜看了英雄联盟S14总决赛,BLG vs T1, 2:3 本来2:1很有机会,但
第四局第五局的faker真的发挥了200%的水平,逆转夺冠
我看的很难受。尤其是赛后很多人踩脸
我不知道为什么全华班追求冠军是一种过错
什么开香槟不谦逊都成了罪过,怎么给自己打气也要批评?
星际韩国包圆,李培楠也努力追求冠军不放弃
街霸日本包圆,曾卓君也努力追求冠军
dota有wings,就算lgd ti10打的气人也是追求过了
唯独lol,我是真无法理解有这么多喜欢狗仗人势的观众
这样的环境,真令人遗憾
也许这次就相当于dota ti8吧 大家记住了水人泼高地记住了on出乱送,然后顺便骂捞批捞底座赛区杂交赛区
真令人遗憾
C++ 中文周刊 2024-10-28 第170期
公众号
点击「查看原文」跳转到 GitHub 上对应文件,链接就可以点击了
qq群 点击进入 满了加这俩 729240657 866408334
欢迎投稿,推荐或自荐文章/软件/资源等,评论区留言
本期文章由 HNY 赞助 在此表示感谢
资讯
标准委员会动态/ide/编译器信息放在这里
编译器信息最新动态推荐关注hellogcc公众号 本周更新 第277期
文章
On designing Tenseur, A C++ tensor library with lazy evaluation
这个人写了个类似eigen的库,介绍他的设计原理。其实主要是表达式模版,这里举一个例子
比如你有一个数组相加的场景,但想延迟计算
原型
/// @brief class representing a mathematical 3D vector
class Vec : public std::array<double, 3> {
public:
using std::array<double, 3>::array;
// inherit constructor (C++11)
// see https://en.cppreference.com/w/cpp/language/using_declaration
};
/// @brief sum 'u' and 'v' into a new instance of Vec
Vec operator+(Vec const &u, Vec const &v) {
Vec sum;
for (size_t i = 0; i < u.size(); i++) {
sum[i] = u[i] + v[i];
}
return sum;
}
Vec x = a + b + c
就有点低效了,中间结果优化不掉
我们的想法就是让operator+推迟,比如a+b生成一个VecSum 他本身不实际计算,直到多个VecSum合并成一个VecSum之后再计算
显然这种转发得用CRTP
template <typename E>
class VecExpression {
public:
static constexpr bool is_leaf = false;
double operator[](size_t i) const {
// Delegation to the actual expression type. This avoids dynamic polymorphism (a.k.a. virtual functions in C++)
return static_cast<E const&>(*this)[i];
}
size_t size() const { return static_cast<E const&>(*this).size(); }
};
class Vec : public VecExpression<Vec> {
std::array<double, 3> elems;
public:
static constexpr bool is_leaf = true;
decltype(auto) operator[](size_t i) const { return elems[i]; }
decltype(auto) &operator[](size_t i) { return elems[i]; }
size_t size() const { return elems.size(); }
// construct Vec using initializer list
Vec(std::initializer_list<double> init) {
std::copy(init.begin(), init.end(), elems.begin());
}
// A Vec can be constructed from any VecExpression, forcing its evaluation.
template <typename E>
Vec(VecExpression<E> const& expr) {
for (size_t i = 0; i != expr.size(); ++i) {
elems[i] = expr[i];
}
}
};
template <typename E1, typename E2>
class VecSum : public VecExpression<VecSum<E1, E2> > {
// cref if leaf, copy otherwise
typename std::conditional<E1::is_leaf, const E1&, const E1>::type _u;
typename std::conditional<E2::is_leaf, const E2&, const E2>::type _v;
public:
static constexpr bool is_leaf = false;
VecSum(E1 const& u, E2 const& v) : _u(u), _v(v) {
assert(u.size() == v.size());
}
decltype(auto) operator[](size_t i) const { return _u[i] + _v[i]; }
size_t size() const { return _v.size(); }
};
template <typename E1, typename E2>
VecSum<E1, E2>
operator+(VecExpression<E1> const& u, VecExpression<E2> const& v) {
return VecSum<E1, E2>(*static_cast<const E1*>(&u), *static_cast<const E2*>(&v));
}
这样 a+b+c
的类型是 VecSum<VecSum<Vec, Vec>, Vec>
Vec x = a + b + c
会调用Vec(VecExpression<E> const& expr)
elems[i] = expr[i];
会展开成elems[i] = a.elems[i] + b.elems[i] + c.elems[i]
这样就没有临时Vec对象了
教你 require用法
基本,require concept
template <typename T>
auto debug_output(const T&) { // default implementation
return "???";
}
template <typename T>
requires std::integral<T>
auto debug_output(const T& t) {
// return a range of characters representing the integer value of t
}
template <typename T>
requires std::floating_point<T>
auto debug_output(const T& t) {
// return a range of characters representing the floating point value of t
}
用在constexpr里
template <typename Cont, typename Rng>
void cont_assign(Cont& cont, Rng&& rng) {
cont.clear();
if constexpr (requires { cont.reserve(std::ranges::size(rng)); }) {
cont.reserve(std::ranges::size(rng));
}
for (auto&& elem : std::forward<Rng>(rng)) {
cont.push_back(std::forward<decltype(elem)>(elem));
}
}
requires requires, requires本身就是concept
template <typename T>
requires requires(const T& t) { t.debug_output(); }
auto debug_output(const T& t) noexcept(noexcept(t.debug_output())) {
return t.debug_output();
}
requires { requires } 用在constexpr里
template <std::ranges::forward_range Rng>
bool all_same(Rng&& rng) {
if constexpr (requires { requires tc::constexpr_size<Rng>() <= 1; }) {
return true;
} else {
… // loop as before
}
}
Heterogeneous lookup in unordered C++ containers
透明查找,避免复制,默认不开,怎么开?看代码
struct stringly_hash
{
using is_transparent = void;
[[nodiscard]] size_t operator()(char const* rhs) const
{
return std::hash<std::string_view>{}(rhs);
}
[[nodiscard]] size_t operator()(std::string_view rhs) const
{
return std::hash<std::string_view>{}(rhs);
}
[[nodiscard]] size_t operator()(std::string const& rhs) const
{
return std::hash<std::string>{}(rhs);
}
};
template <typename ValueType>
using unordered_string_map = std::unordered_map<
std::string,
ValueType,
stringly_hash,
std::equal_to<>
>;
咱们说过挺多次了
Zero or sign extend
讨论一种场景,无符号数/有符号数的扩展问题,比如给你一个11位的数字,你给扩展到32位
一种最简单的写法
int32 sign_extend(int32 val_11b) {
int32 t = val_11b << (32 - 11);
return t >> (32 - 11);
}
举例
// 假设输入的11位数是: 000 0010 1001 (原始值为41)
int32 t = val_11b << (32 - 11); // 左移21位
// 变成: 0010 1001 0000 0000 0000 0000 0000 0000
return t >> (32 - 11); // 算术右移21位
// 变成: 0000 0000 0000 0000 0000 0000 0010 1001 (仍然为41)
// 如果输入是负数,比如 110 0010 1001 (-215)
// 左移后: 0010 1001 0000 0000 0000 0000 0000 0000
// 算术右移后: 1111 1111 1111 1111 1111 1110 0010 1001 (-215)
>>
移动保留符号,所以这么玩也不会存在问题,但可能依赖数字实现(补码反码问题)
考虑位运算
int sign_extend(int val_11b) {
return (val_11b & 0x3ff) - (val & 0x400);
}
0x3ff和400哪里来的?0x400是11位, 0x3ff是后10位
举例
// 对于正数 0010 1001 (41):
(41 & 0x3ff) - (41 & 0x400)
= 41 - 0 = 41
// 对于负数 1100 1001 (-215):
(0x329 & 0x3ff) - (0x329 & 0x400)
= 809 - 1024 = -215
当然还有更简洁的
int sign_extend(int val_11b) {
return val - (val & 0x400) * 2;
}
举例
// 对于正数 0010 1001 (41):
41 - (41 & 0x400) * 2
= 41 - (0) * 2
= 41 - 0
= 41
// 对于负数 1100 1001 (原值 809):
809 - (809 & 0x400) * 2
= 809 - (0x400) * 2
= 809 - 2048
= -215
让我们从11位扩展到任意位(小于32)
int zero_or_sign_extend(int val, int sign_bit) {
return val - (val & sign_bit) * 2;
}
当然也可以异或
int zero_or_sign_extend(int val, int sign_bit) {
return (val ^ sign_bit) - sign_bit;
}
举例
// 对于11位正数 0010 1001 (41), sign_bit = 0x400:
(41 ^ 0x400) - 0x400
= 1065 - 1024
= 41
// 对于11位负数 1100 1001 (809), sign_bit = 0x400:
(809 ^ 0x400) - 0x400
= 809 - 1024
= -215
// 对于8位数:
// 正数 0100 0001 (65), sign_bit = 0x80:
(65 ^ 0x80) - 0x80
= 193 - 128
= 65
// 负数 1100 0001 (193), sign_bit = 0x80:
(193 ^ 0x80) - 0x80
= 65 - 128
= -63
Inserting a 0 bit in the middle of a value
这个背景可以不提,简单说就是给一个二进制中间差一个0,很妙的办法,直觉来说怎么写?
首先给位置分两段,低位不变,高位置移动一位,然后拼起来,对不对
uint64 insert_zero_bit(uint64 value, int pos) {
uint64 bottom_mask = (1u64 << pos) - 1;
uint64 top_mask = ~bottom_mask;
uint64 bottom_bits = value & bottom_mask;
uint64 top_bits = value & top_mask;
return bottom_bits | (top_bits << 1);
}
代码也很直观,咱们拿一个例子带入一下
假如 1 0 1 1 0 1 0 1 -> 1 0 1 1 0 0 1 0 1
第四位插个0 pos=3
首先拿到bottom_mask 0 0 0 0 0 0 0 1左移3位减一 0 0 0 0 0 1 1 1
top mask就是 1 1 1 1 1 0 0 0
bottom_bits就是 1 0 1 1 0 1 0 1 保留后三位 0 0 0 0 0 1 0 1
top_bits 就是1 0 1 1 0 1 0 1 保留前五位 1 0 1 1 0 0 0 0
然后top bit左移一位组合1 0 1 1 0 0 0 0 0 | 0 0 0 0 0 1 0 1 -> 1 0 1 1 0 0 1 0 1
这里提到了一个优化的写法
我们要做的就是高位移动一位,就不要考虑低位了,还要算来算去
最简单的移动方法就是自己加自己对不对? 1 + 1 -> 10
那我高位加自己不就解决了?
这也就是优化算法的原理
uint64 insert_zero_bit(uint64 value, int pos) {
uint64 top_mask = ~0u64 << pos;
return value + (value & top_mask);
}
首先我们找到高位,然后高位相加等于移动一位,然后低位没加,不变
很巧妙的思路,就是不能一次性加多个0,得一点一点加
当然同理,我们可以弄一个去掉0 的算法
uint64 remove_zero_bit(uint64 value, int pos) {
uint64 top_mask = ~0u64 << pos;
return value - ((value & top_mask) >> 1);
}
注意我们知道指定位置是0,所以移动没啥影响,如果指定去除位置的值,就不能这么简单的算了
一切的前提是知道指定pos是0 的前提下展开的
Triaging clang C++ frontend bugs
教你处理clang前端bug/修复指引
Implementing Trivial Relocation in Library
介绍trivial relocation基于反射的实现。复杂。看一乐,这个之前提到过,是两个提案实现方法不同,一直在吵架
Placeholder substitution in the preprocessor
用宏实现了magic enum类似手法。这拖代码屎一样 godbolt
开源项目介绍
[上一期...
C++ 中文周刊 2024-10-22 第169期
公众号
点击「查看原文」跳转到 GitHub 上对应文件,链接就可以点击了
qq群 点击进入 满了加这俩 729240657 866408334
欢迎投稿,推荐或自荐文章/软件/资源等,评论区留言
资讯
标准委员会动态/ide/编译器信息放在这里
编译器信息最新动态推荐关注hellogcc公众号 本周更新 2024-10-16 第276期
重点还是反射
让status更好的move,避免使用误用, 一个pr观察
起因
if (auto&& status = functionReturningArrowResult().status(); status.ok())
return 0;
return -1;
显然status是调用出现问题,status()返回的不是值而是const Status& ,而函数执行完了,所以这个Status已经析构,UB
这个问题和range for loop中的悬垂引用问题一样。
这里引入了一个解决办法,支持多种status()方法
constexpr const Status& status() const& { return status_; }
Status status() && { return status_; }
status() 支持两种 分别是普通引用和万能引用,及时的把值复制出来
这种场景我以前也介绍过,但是不单单这么简单,这个PR还改动了别的地方
/// Helper method for implementing Status returning functions in terms of semantically
/// equivalent Result returning functions. For example:
///
/// Status GetInt(int *out) { return GetInt().Value(out); }
template <typename U, typename E = typename std::enable_if<
std::is_constructible<U, T>::value>::type>
Status Value(U* out) && {
if (!ok()) {
- return status();
+ return std::move(*this).status();
}
*out = U(MoveValueUnsafe());
return Status::OK();
}
这算是一个挺妙的改动,std::move(*this)强制右值,这样就会调用status() && 从而帮助编译器优化潜在的悬垂场景
这种增加&&方法不是简单的增加一个就完了,还有其余的影响也需要覆盖到。这个PR算是见到一个思路
文章
Detect C++ Memory Leaks with ALSan: Attachable Leak Sanitizer - Bojun Seo - C++Now 2024
觉得 -fsanitize=leak
需要preload重跑
麻烦,自己写了个基于ebpf的
What is faster: vec.emplace_back(x) or vec[x] ?
emplace_back没有向量化优势
Iterating through matched characters in modern C++
查找,代码
std::string data = load_file_content("data.html");
std::string_view targets = "<&\r\0";
auto start = data.begin();
auto end = data.end();
while (start != end) {
start = std::find_first_of(start, end, targets.begin(),
targets.end());
if (start != end) {
/* you are pointing at start */
}
}
也可以这样写
size_t location = 0;
while ((location = data.find_first_of(targets, location)) !=
std::string::npos) {
// matched character at data[location]
location++;
}
还可以用range
auto matched_characters =
data | std::views::filter([](char c) {
return c == '<' | c == '&' | c == '\r' | c == '\0';
});
for (const char &c : matched_characters) {
/* you hold a reference to a matched character */
};
甚至可以这样写
auto target_finder = [](auto& data,
auto& targets) -> std::generator<const char *> {
auto start = data.begin();
auto end = data.end();
while (start != end) {
start = std::find_first_of(start, end, targets.begin(),
targets.end());
if (start == end) {
co_return;
}
co_yield start;
start++;
}
};
for (auto match : target_finder(data, targets)) {
/* match is a matched character*/
};
性能比较差还是算了
A Two Dimensional Low Discrepancy Shuffle Iterator (+Random Access & Inversion)
Scaling Points In a Specific Direction
看不懂,图形学的,标记一个TODO
Why don’t compilers warn for const T f()?
告警太多,干脆忽略,反正没用
Replace strings by views when you can
view传值更省,const string&潜在拷贝风险/指针不能彻底优化
他的这个例子是string table vs 巨大array + stringview维护,stringview占优势。代码就不贴了
Reflection in C++26
直接贴代码
简单例子
#include <iostream>
#include <cassert>
#include <concepts>
int main() {
constexpr auto r = ^int;
typename[:r:] x = 42; // Same as: int x = 42;
typename[:^char:] c = '*'; // Same as: char c = '*';
static_assert(std::same_as<decltype(x), int>);
static_assert(std::same_as<decltype(c), char>);
assert(x == 42);
assert(c == '*');
}
使用^拿到类型 std::meta::info,使用[: :] 使用类型
一个enum转string例子
#include <iostream>
#include <experimental/meta>
#include <string>
#include <type_traits>
template<typename E>
requires std::is_enum_v<E> // (1)
constexpr std::string enum_to_string(E value) {
std::string result = "<unnamed>";
[:expand(std::meta::enumerators_of(^E)):] >> // (2)
[&]<auto e>{
if (value == [:e:]) {
result = std::meta::identifier_of(e); // (3)
}
};
return result;
}
template <typename E>
requires std::is_enum_v<E>
constexpr std::optional<E> string_to_enum(std::string_view name) {
template for (constexpr auto e : std::meta::enumerators_of(^E)) {
if (name == std::meta::identifier_of(e)) {
return [:e:];
}
}
return std::nullopt;
}
int main() {
enum Color { red, green, blue };
std::cout << "enum_to_string(Color::red): " << enum_to_string(Color::red) << '\n';
}
(2) 不好懂,你就当一种特殊语法好了,执行指定lambda
内置的metafunction非常多
namespace std::meta {
using info = decltype(^::);
template <typename R>
concept reflection_range = /* see above */;
// name and location
consteval auto identifier_of(info r) -> string_view;
consteval auto u8identifier_of(info r) -> u8string_view;
consteval auto display_string_of(info r) -> string_view;
consteval auto u8display_string_of(info r) -> u8string_view;
consteval auto source_location_of(info r) -> source_location;
// type queries
consteval auto type_of(info r) -> info;
consteval auto parent_of(info r) -> info;
consteval auto dealias(info r) -> info;
// object and value queries
consteval auto object_of(info r) -> info;
consteval auto value_of(info r) -> info;
// template queries
consteval auto template_of(info r) -> info;
consteval auto template_arguments_of(info r) -> vector<info>;
// member queries
consteval auto members_of(info type_class) -> vector<info>;
consteval auto bases_of(info type_class) -> vector<info>;
consteval auto static_data_members_of(info type_class) -> vector<info>;
consteval auto nonstatic_data_members_of(info type_class) -> vector<info>;
consteval auto subobjects_of(info type_class) -> vector<info>;
consteval auto enumerators_of(info type_enum) -> vector<info>;
// member access
struct access_context {
static consteval access_context current() noexcept;
consteval access_context() noexcept;
};
consteval auto is_accessible(
info r,
acess_context from = access_context::current());
consteval auto accessible_members_of(
info target,
access_context from = access_context::current()) -> vector<info>;
consteval auto accessible_bases_of(info target,
info target,
access_context from = access_context::current()) -> vector<info>;
consteval auto accessible_nonstatic_data_members_of(
info target,
access_context from = access_context::current()) -> vector<info>;
consteval auto accessible_static_data_members_of(
info target,
access_context from = access_context::current()) -> vector<info>;
consteval auto accessible_subobjects_of(
info target,
access_context from = access_context::current()) -> vector<info>;
// substitute
template <reflection_range R = initializer_list<info>>
consteval auto can_substitute(info templ, R&& args) -> bool;
template <reflection_range R = initializer_list<info>>
consteval auto substitute(info templ, R&& args) -> info;
// reflect_invoke
template <reflection_range R = initializer_list<info>>
consteval auto reflect_invoke(info target, R&& args) -> info;
template <reflection_range R1 = initializer_list<info>, reflection_range R2 = initializer_list<info>>
consteval auto reflect_invoke(info target, R1&& tmpl_args, R2&& args) -> info;
// reflect expression results
template <typename T>
consteval auto reflect_value(T value) -> info;
template <typename T>
consteval auto reflect_object(T& value) -> info;
template <typename T>
consteval auto reflect_function(T& value) -> info;
// extract
template <typename T>
consteval auto extract(info) -> T;
// other type predicates (see the wording)
consteval auto is_public(info r) -> bool;
consteval auto is_protected(info r) -> bool;
consteval auto is_private(info r) -> bool;
consteval auto is_virtual(info r) -> bool;
consteval auto is_pure_virtual(info entity) -> bool;
consteval auto is_override(info entity) -> bool;
consteval auto is_final(info r) -> bool;
consteval auto is_deleted(info entity) -> bool;
consteval auto is_defaulted(info entity) -> bool;
consteval auto is_explicit(info entity) -> bool;
consteval auto is_noexcept(info entity) -> bool;
consteval au...
C++ 中文周刊 2024-09-07 第168期
公众号
点击「查看原文」跳转到 GitHub 上对应文件,链接就可以点击了
qq群 点击进入
欢迎投稿,推荐或自荐文章/软件/资源等,评论区留言
本期文章由 HNY Amnesia 赞助 在此表示感谢
资讯
标准委员会动态/ide/编译器信息放在这里
文章
隆重介绍proxy 3.0版本,更好用的fat pointer库
看个乐呵,其实还是要面向需求,这个概念起码16/17年就有了,隔壁rust有用,folly::Poly没听说有谁用
为什么 const 无法让 C 代码跑得更快?
省流,约束自己的,编译器足够聪明能分析出优化点,用const指引没啥帮助
使用static 快十倍
看看作者给的B代码
uint64_t modulus = 1ULL << 31; // 2^31
// static uint64_t modulus = 1ULL << 31; // 2^31
uint64_t loop(uint64_t N, uint64_t S, uint64_t P, uint64_t Q) {
for (uint64_t i = 0; i < N; i++) {
S = (S*P+Q) % modulus;
}
return S;
}
把modulus改成static就内联了。
不是哥们,你直接用宏/constexpr得了呗,又不改动,全局变量影响多大没有数?
回顾shared ptr实现
template<typename T>
class shared_ptr {
ctrl_blk_base* ctrl_blk_{};
T* t_{};
shared_ptr(ctrl_blk_with_storage<T>* cb)
: shared_ptr{cb, cb->get()}
{}
shared_ptr(ctrl_blk_base* cb, T* t)
: ctrl_blk_{cb}
, t_{t}
{}
template<typename U, typename... Args>
friend shared_ptr<U> make_shared(Args&&... vals);
public:
shared_ptr() = default;
shared_ptr(T* t)
: shared_ptr{new ctrl_blk<T>{t}, t}
{}
~shared_ptr()
{
if(ctrl_blk_) { ctrl_blk_->release_shared(); }
}
shared_ptr(const shared_ptr& rhs)
: ctrl_blk_{rhs.ctrl_blk_}
, t_{rhs.t_}
{
if(ctrl_blk_) { ctrl_blk_->add_shared(); }
}
shared_ptr(shared_ptr&& rhs)
: ctrl_blk_{rhs.ctrl_blk_}
, t_{rhs.t_}
{
rhs.ctrl_blk_ = nullptr;
rhs.t_ = nullptr;
}
shared_ptr& operator=(const shared_ptr& rhs)
{
shared_ptr{rhs}.swap(*this); // forward to copy ctor
return *this;
}
shared_ptr& operator=(shared_ptr&& rhs)
{
shared_ptr{std::move(rhs)}.swap(*this); // forward to move-ctor
return *this;
}
void swap(shared_ptr& rhs)
{
std::swap(t_, rhs.t_);
std::swap(ctrl_blk_, rhs.ctrl_blk_);
}
};
template<typename T, typename... Args>
shared_ptr<T> make_shared(Args&&... vals)
{
return new ctrl_blk_with_storage<T>(std::forward<Args>(vals)...);
}
struct ctrl_blk_base {
std::atomic_uint64_t shared_ref_count_{1};
void add_shared() { ++shared_ref_count_; }
auto dec() { return --shared_ref_count_; }
virtual void release_shared() = 0;
};
template<typename T>
struct ctrl_blk : ctrl_blk_base {
T* data_;
explicit ctrl_blk(T* data)
: ctrl_blk_base{}
, data_{data}
{}
void release_shared() override
{
if(0 == dec()) {
delete data_;
delete this; // self delete
}
}
};
template<typename T>
struct ctrl_blk_with_storage : ctrl_blk_base {
T in_place_;
template<typename... Args>
explicit ctrl_blk_with_storage(Args&&... vals)
: ctrl_blk_base{}
, in_place_{std::forward<Args>(vals)...}
{}
T* get() { return &in_place_; }
void release_shared() override
{
if(0 == dec()) {
delete this; // self delete
}
}
};
非常简单,大家看懂了吗
RealtimeSanitizer
llvm引入了新的sanitizer, RTSan 标记了noblocking的函数只要监测到路径中存在 malloc, free, pthread_mutex_lock,就会报错
看样例
#include <vector>
void violation() [[clang::nonblocking]]{
std::vector<float> v;
v.resize(100);
}
int main() {
violation();
return 0;
}
//clang++ -fsanitize=realtime -g example_realtime_violation.cpp
输出
clang++ -fsanitize=realtime -g example_realtime_violation.cpp
./a.out
Real-time violation: intercepted call to real-time unsafe function `malloc` in real-time context! Stack trace:
0 0x000102893034 in __rtsan::PrintStackTrace() rtsan_stack.cpp:45
1 0x000102892e64 in __rtsan::Context::ExpectNotRealtime(char const*) rtsan_context.cpp:78
2 0x00010289397c in malloc rtsan_interceptors.cpp:286
3 0x000195bd7bd0 in operator new(unsigned long)+0x1c (libc++abi.dylib:arm64+0x16bd0)
4 0x5c7f00010230f07c (<unknown module>)
5 0x00010230f058 in std::__1::__libcpp_allocate[abi:ue170006](unsigned long, unsigned long) new:324
6 0x00010230effc in std::__1::allocator<float>::allocate[abi:ue170006](unsigned long) allocator.h:114
... snip ...
10 0x00010230e4bc in std::__1::vector<float, std::__1::allocator<float>>::__append(unsigned long) vector:1162
11 0x00010230dcdc in std::__1::vector<float, std::__1::allocator<float>>::resize(unsigned long) vector:1981
12 0x00010230dc28 in violation() main.cpp:5
13 0x00010230dd64 in main main.cpp:9
14 0x0001958960dc (<unknown module>)
15 0x2f557ffffffffffc (<unknown module>)
还是很准的,可以更好的控制快速路径中的可能阻塞的函数调用
如何使用?最新llvm
cmake -DCMAKE_BUILD_TYPE=Release -DLLVM_ENABLE_PROJECTS="clang" -DLLVM_ENABLE_RUNTIMES="compiler-rt" <path to source>/llvm
使用bfloat16来压缩浮点数
lemire新活,
并不需要那么的精确,可以使用brain float 16 显然计算带宽四倍,如果用上SIMD,那速度可以更快
#include <immintrin.h>
#include <cstddef>
#include <cstdint>
void to_float16(uint16_t *dst, const double *src, size_t length) {
size_t i = 0;
__mmask8 mask;
// Process 8 elements at a time
for (; i + 7 < length; i += 8) {
// Load 8 double-precision floats
__m512d src_vec = _mm512_loadu_pd(&src[i]);
// Convert to 16-bit floats with rounding
__m128bh dst_vec = _mm256_cvtneps_pbh(_mm512_cvt_roundpd_ps(src_vec, _MM_FROUND_TO_NEAREST_INT |_MM_FROUND_NO_EXC));
// Store the result
_mm_storeu_si128((__m128i*)&dst[i], *(__m128i*)&dst_vec);
}
// Handle remaining elements
if (i < length) {
// Create a mask for the remaining elements
mask = (1 << (length - i)) - 1;
// Load remaining double-precision floats
__m512d src_vec = _mm512_maskz_loadu_pd(mask, &src[i]);
// Convert to 16-bit floats with rounding
__m128bh dst_vec = _mm256_cvtneps_pbh(_mm512_cvt_roundpd_ps(src_vec, _MM_FROUND_TO_NEAREST_INT |_MM_FROUND_NO_EXC));
// Store the result with masking
_mm_mask_storeu_epi16(&dst[i], mask, *(__m128i*)&dst_vec);
}
}
void from_float16(double *dst, const uint16_t *src, size_t length) {
size_t i = 0;
__mmask8 mask;
// Process 8 elements at a time
for (; i + 7 < length; i += 8) {
// Load 8 half-precision floats
__m128i src_vec = _mm_loadu_si128((__m128i*)&src[i]);
// Convert to double-precision floats
__m512d dst_vec = _mm512_cvtps_pd(_mm256_cvtpbh_ps(*(__m128bh*)&src_vec));
// Store the result
_mm512_storeu_pd(&dst[i], dst_vec);
}
// Handle remaining elements
if (i < length) {
// Create a mask for the remaining elements
mask = (1 << (length - i)) - 1;
// Load remaining half-precision floats
__m128i src_vec = _mm_maskz_loadu_epi16(mask, &src[i]);
// Convert to double-precision floats
__m512d dst_vec = _mm512_cvtps_pd(_mm256_cvtpbh_ps( *(__m128bh*)&src_vec));
// Store the result with masking
_mm512_mask_storeu_pd(&dst[i], mask, dst_vec);
}
}
作者测试压缩2亿条每秒,解压0.9亿条每秒
考虑geo/AI之类的不精确场景,这种压缩带来的提升是非常迅速的
开源项目介绍
- asteria 一个脚本语言,可嵌入,长期找人,希望胖友们帮帮忙,也可以加群753302367和作者对线
简单代码段分享
一个c的enum to string
#include <stdio.h>
#include <string.h>
#define NUMARGS(...) (sizeof((int[]){__VA_ARGS__})/sizeof(int))
#define ENUM_TO_STRING(ENUM_NAME, ...) \
enum ENUM_NAME { __VA_ARGS__ }; \
char ENUM_NAME##_strings[] = #__VA_ARGS__ ; \
long ENUM_NAME##strings_indices[NUMARGS(__VA_ARGS__)]; \
char *ENUM_NAME##_to_string(enum ENUM_NAME value) { \
static int init = 0; \
if(init == 0){ \
int n = 0; \
ENUM_NAME##strings_indices[n++] = 0; \
char* curr_pos = strchr(ENUM_NAME##_strings,','); \
while(curr_pos){ \
*curr_pos = '\0'; \
ENUM_NAME##strings_indices[n++]= (++curr_pos - ENUM_NAME##_strings); \
curr_pos = strchr(curr_pos,','); \
} \
init++; \
} \
return (char *)ENUM_NAME##_strings+ENUM_NAME##strings_indices[value]; \
}
/* Usage just create the enum */
ENUM_TO_STRING(Color,RED,GREEN,BLUE,VIOLET)
int main(void)
{
printf("%s...
C++ 中文周刊 2024-08-31 第167期
本期文章由 HNY 赞助
资讯
标准委员会动态/ide/编译器信息放在这里
编译器信息最新动态推荐关注hellogcc公众号 本周更新 2024-08-21 第268期
文章
C++20 Modules 在阿里云的大规模应用
看一乐
MySQL 编译(打包
看一乐 感谢恒星投稿
Visualizing boost::unordered_map in GDB, with pretty-printer customization points
给boost unordered实现gdb pretty print
gdb使用pretty print很简单
第一步
(gdb) set print pretty on
第二步,如果你的脚本在二进制的section中
(gdb) add-auto-load-safe-path path/to/executable
如果没有,有脚本,可以加载脚本
(gdb) source path/to/boost/libs/unordered/extra/boost_unordered_printers.py
其实脚本内容和放进二进制section内容是一样的,怎么放进二进制?可以学习这个 https://github.com/boostorg/outcome/blob/master/include/boost/outcome/outcome_gdb.h
我相信大部分读者是第一次知道gdb printer可以放到二进制里的
接下来是如何实现gdb printer
很简单,接口就这样
class BoostUnorderedFcaPrinter:
def __init__(self, val):
self.val = val
def to_string(self):
return f"This is a {self.val.type}"
目标,实现to_string
注册也非常简单
def boost_unordered_build_pretty_printer():
pp = gdb.printing.RegexpCollectionPrettyPrinter("boost_unordered")
add_template_printer = lambda name, printer: pp.add_printer(name, f"^{name}<.*>$", printer)
add_template_printer("boost::unordered::unordered_map", BoostUnorderedFcaPrinter)
add_template_printer("boost::unordered::unordered_multimap", BoostUnorderedFcaPrinter)
add_template_printer("boost::unordered::unordered_set", BoostUnorderedFcaPrinter)
add_template_printer("boost::unordered::unordered_multiset", BoostUnorderedFcaPrinter)
return pp
gdb.printing.register_pretty_printer(gdb.current_objfile(), boost_unordered_build_pretty_printer())
继续,咱们展开成员
def maybe_unwrap_foa_element(e):
element_type = "boost::unordered::detail::foa::element_type<"
if f"{e.type.strip_typedefs()}".startswith(element_type):
return e["p"]
else:
return e
简单吧,现在你学会了gdb.Value.type.strip_typedefs
咱们进化一下
class BoostUnorderedFcaPrinter:
def __init__(self, val):
self.val = val
self.name = f"{self.val.type.strip_typedefs()}".split("<")[0]
self.name = self.name.replace("boost::unordered::", "boost::")
self.is_map = self.name.endswith("map")
def to_string(self):
size = self.val["table_"]["size_"]
return f"{self.name} with {size} elements"
这样打印
(gdb) print my_unordered_map
$1 = boost::unordered_map with 3 elements
(gdb) print my_unordered_multiset
$2 = boost::unordered_multiset with 5 elements
考虑遍历成员
def display_hint(self):
return "map"
def children(self):
def generator():
# ...
while condition:
value = # ...
if self.is_map:
first = value["first"]
second = value["second"]
yield "", first
yield "", second
else:
yield "", count
yield "", value
return generator()
后面就不展开了
gdb python的玩法还是非常多的
PS: 吴乎提问: 放进二进制section这个,strip时不知道是跟着debug符号走,还是跟着binary走
笔者查了一下,使用的section debug_gdb_scripts也是debug symbol,strip会被删,
这种建议先strip后objcopy把debug_gdb_scripts搞回来 详情点击这个SO
gdb section可以看这里
SIMD Matters
图形生成算法使用simd性能提升显著。代码就不贴了
Honey, I shrunk {fmt}: bringing binary size to 14k and ditching the C++ runtime
介绍了fmtlib在减小二进制上的探索,比如查表优化
auto do_count_digits(uint32_t n) -> int {
// An optimization by Kendall Willets from https://bit.ly/3uOIQrB.
// This increments the upper 32 bits (log10(T) - 1) when >= T is added.
# define FMT_INC(T) (((sizeof(#T) - 1ull) << 32) - T)
static constexpr uint64_t table[] = {
FMT_INC(0), FMT_INC(0), FMT_INC(0), // 8
FMT_INC(10), FMT_INC(10), FMT_INC(10), // 64
FMT_INC(100), FMT_INC(100), FMT_INC(100), // 512
FMT_INC(1000), FMT_INC(1000), FMT_INC(1000), // 4096
FMT_INC(10000), FMT_INC(10000), FMT_INC(10000), // 32k
FMT_INC(100000), FMT_INC(100000), FMT_INC(100000), // 256k
FMT_INC(1000000), FMT_INC(1000000), FMT_INC(1000000), // 2048k
FMT_INC(10000000), FMT_INC(10000000), FMT_INC(10000000), // 16M
FMT_INC(100000000), FMT_INC(100000000), FMT_INC(100000000), // 128M
FMT_INC(1000000000), FMT_INC(1000000000), FMT_INC(1000000000), // 1024M
FMT_INC(1000000000), FMT_INC(1000000000) // 4B
};
auto inc = table[__builtin_clz(n | 1) ^ 31];
return static_cast<int>((n + inc) >> 32);
}
template <typename T> constexpr auto count_digits_fallback(T n) -> int {
int count = 1;
for (;;) {
// Integer division is slow so do it for a group of four digits instead
// of for every digit. The idea comes from the talk by Alexandrescu
// "Three Optimization Tips for C++". See speed-test for a comparison.
if (n < 10) return count;
if (n < 100) return count + 1;
if (n < 1000) return count + 2;
if (n < 10000) return count + 3;
n /= 10000u;
count += 4;
}
}
这两种用法,查表就是要多一堆符号的,如果业务要小二进制,就不用查表
另外就是 -nodefaultlibs
-fno-exceptions
这种场景下 new delete基本也得去掉 最后减小到14K,如果去除main6k fmt整体小于10k
Faster random integer generation with batching
批量生成随机数相当于给一堆数打散,第一反应就是shuffle
void shuffle(mytype *storage, uint64_t size) {
for (uint64_t i = size; i > 1; i--) {
uint64_t nextpos = random(i); // random value in [0,i)
std::swap(storage[i - 1], storage[nextpos]);
}
}
显然这个shuffle中的random是瓶颈,我们常规的实现就是%i,有没有更快的做法?
uint64_t random_bounded(uint64_t range) {
__uint128_t random64bit, multiresult;
uint64_t leftover;
uint64_t threshold;
random64bit = rng(); // 64-bit random integer
multiresult = random64bit * range;
leftover = (uint64_t)multiresult;
if (leftover < range) {
threshold = -range % range;
while (leftover < threshold) {
random64bit = rng();
multiresult = random64bit * range;
leftover = (uint64_t)multiresult;
}
}
return (uint64_t)(multiresult >> 64); // [0, range)
}
/ Fisher-Yates shuffle
void shuffle(uint64_t *storage, uint64_t size, uint64_t (*rng)(void)) {
uint64_t i;
for (i = size; i > 1; i--) {
uint64_t nextpos = random_bounded(i, rng);
uint64_t tmp = storage[i - 1];
uint64_t val = storage[nextpos];
storage[i - 1] = val;
storage[nextpos] = tmp;
}
}
这实际上也是gcc的实现,我们能不能拆成批量shuffle?
考虑一个场景,你需要多个shuffle,显然每次都执行random_bound代价大
能不能一个random_bound把多个shuffle一起计算?当然可以
然后多个shuffle组合成一个shuffle就是修改index的问题了是不是?
比如拆成两个
// product_bound can be any integer >= range1*range2
// it may be updated to become range1*range2
std::pair<uint64_t, uint64_t>
random_bounded_2(uint64_t range1, uint64_t range2,
uint64_t &product_bound) {
__uint128_t random64bit, multiresult;
uint64_t leftover;
uint64_t threshold;
random64bit = rng(); // 64-bit random integer
multiresult = random64bit * range1;
leftover = (uint64_t)multiresult;
uint64_t result1 = (uint64_t)(multiresult >> 64); // [0, range1)
multiresult = leftover * range2;
leftover = (uint64_t)multiresult;
uint64_t result2 = (uint64_t)(multiresult >> 64); // [0, range2)
if (leftover < product_bound) {
product_bound = range2 * range1;
if (leftover < product_bound) {
threshold = -product_bound % product_bound;
while (leftover < threshold) {
random64bit = rng();
multiresult = random64bit * range1;
leftover = (uint64_t)multiresult;
result1 = (uint64_t)(multiresult >> 64); // [0, range1)
multiresult = leftover * range2;
leftover = (uint64_t)multiresult;
result2 = (uint64_t)(multiresult >> 64); // [0, range2)
}
}
}
return std::make_pair(result1, result2);
}
void shuffle_2(mytype *storage, uint64_t size) {
uint64_t i = size;
for (; i > 1 << 30; i--) {
uint64_t index = random_bounded(i, g);
// index is in [0, i-1]
std::swap(storage[i - 1], storage[index]);
}
// Batches of 2 for sizes up to 2^30 elements
uint64_t product_bound = i * (i - 1);
for (; i > 1; i -= 2) {
auto [index1, index2] = random_bounded_2(i, i - 1,
product_bound, g);
// index1 is in [0, i-1]
// index2 is in [0, i-2]
std::swap(storage[i - 1], storage[index1]);
std::swap(storage[i - 2], storage[index2]);
}
}
测试linux gcc快30%
Parsing tiny and very large floating-point values: a programming-language comparison
处理无限大无限小,各种语言的差别
python
>>> float("1e-1000")
0.0
>>> float("1e1000")
inf
golang
package main
import (
"fmt"
"strconv"
)
func main() {
f, err := strconv.ParseFloat("1e-1000"...